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PREFACIO 


El proposito y requisitos previos de este libro 

Estadistica mcitemdtica con aplicaciones fue escrito para el uso de los estudiantes en cursos 
universitarios de un ano (9 horas-trimestre o 6 horas-semestre) de estadistica matematica. 
El proposito de este libro es presentar una solida base al estudiante, de la teoria estadistica 
y al mismo tiempo darle orientation de la relevancia e importancia de la teoria para resolver 
problemas practicos del mundo real. Pensamos que un curso de este tipo es apropiado para 
casi todas las disciplinas de licenciatura, incluyendo matematicas, donde el contacto con apli¬ 
caciones puede ser una experiencia motivadora y alentadora. El unico requisito matematico 
previo es un conocimiento profundo de calculo universitario de primer ano, incluyendo sumas 
de series infinitas, derivadas e integration simple y doble. 

Nuestro metodo 

El hablar con estudiantes que esten tomando un curso inicial de estadistica matematica, o lo 
hayan terminado, revelo una falla importante en numerosos cursos. Los estudiantes pueden 
tomar el curso y terminarlo sin entender claramente la naturaleza de la estadistica. Muchos de 
ellos ven la teoria como un conjunto de temas, con una relation debil o fuerte entre ellos, pero 
no ven que la estadistica es una teoria de information con inferencia como su meta. Ademas, 
pueden terminar el curso sin entender el importante papel que desempenan las estadisticas en 
investigaciones cientificas. 

Estas consideraciones nos llevaron a crear un texto que difiere de otros en tres formas: 

• Primero, la presentation de la probabilidad esta precedida de un claro enunciado del 
objetivo de la estadistica — la inferencia estadistica — y su funcion en la investiga¬ 
tion cientifica. A medida que los estudiantes avanzan en la teoria de probabilidades 
(Capitulos 2 al 7), se les recuerda con frecuencia el papel que los temas principales 
desempenan en la inferencia estadistica. El efecto acumulativo es que la inferencia es- 
tadfstica es el tema dominante del curso. 

• La segunda caracterfstica del texto es su conectividad. Explicamos no solo la forma en 
que los temas principales desempenan un papel en inferencia estadistica, sino que tam- 
bien como es que los temas estan relacionados entre si. Estas interesantes explicaciones 
aparecen con mas frecuencia en las introducciones y conclusiones del capitulo. 

• Por ultimo, el texto es unico en su enfasis practico, en ejercicios en todo el libro y 
en los utiles temas metodologicos estadisticos contenidos en los Capftulos del 11 al 
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15, cuya meta es reforzar la base elemental pero solida desarrollada en los capltulos 
iniciales. 

El libro se puede usar en varias formas y adaptarse a los gustos de estudiantes y profesores. 
La dificultad del material puede aumentar o disminuir si se controla la asignacion de los ejer- 
cicios, se eliminan algunos temas y si se hace variar el tiempo dedicado a cada tema. Se puede dar 
un toque de mas aplicacion al eliminar algunos temas, por ejemplo algunas secciones de los 
Capltulos 6 y 7, y dedicar mas tiempo a los capltulos aplicados al final. 


Cambios en la septima edicion 

Existe una gran cantidad de estudiantes que aprovechan la informacion visual de conceptos y 
resultados. Algo nuevo en esta edicion es la inclusion de aplicaciones breves de computadora, 
todas ellas disponibles en llnea para su uso en el sitio web Cengage, www.cengage.com/statis- 
tics/wackerly. Algunas de estas aplicaciones se utilizan para demostrar conceptos estadlsticos, 
otras permiten a los usuarios evaluar el impacto de selecciones de parametro en la forma de 
funciones de densidad y el resto de aplicaciones se pueden usar para hallar probabilidades 
exactas y cuantiles asociados con variables aleatorias gamma, beta, normal, % 2 , t y F distri- 
buidas, todo ello informacion importante cuando se construyen intervalos de confianza o se 
realizan pruebas de hipotesis. Algunas de las aplicaciones aportan informacion existente por 
medio del uso de otros paquetes de software. Destacan entre estas, el lenguaje R y el ambiente 
para computacion y graficas estadlsticas (disponibles gratis en http://www.r-project.org/) se 
puede usar para obtener los cuantiles y probabilidades asociados con las distribuciones dis- 
cretas y continuas ya antes citadas. Los comandos R apropiados se presentan en las secciones 
respectivas de los Capltulos 3 y 4. La ventaja de las aplicaciones breves de computadora es que 
son de estilo “apunte y dispare”, dan graficas adjuntas y son considerablemente mas fa- 
ciles de usar. No obstante, R es mucho mas potente que estas aplicaciones y se puede usar 
para muchos otros fines estadlsticos. Dejamos otras aplicaciones de R al usuario interesado 
o profesor. 

El Capltulo 2 introduce la primera aplicacion breve (applet), Bayes' Rule as a Tree {la 
Regia de Bayes como Arbol), demostracion que permite a los usuarios ver por que a veces se 
obtienen resultados sorprendentes cuando se aplica la regia de Bayes (vea Eigura 1). Al igual 
que en la sexta edicion, las estimaciones de maxima verosimilitud se introducen en el Capltulo 
3 mediante ejemplos para las estimaciones de los parametros de las distribuciones binomiales, 
geometricas y binomiales negativas basadas en valores numericos especlficos observados 
de variables aleatorias que poseen estas distribuciones. Los problemas de seguimiento al final de 
las secciones respectivas se ampllan en estos ejemplos. 

En el Capltulo 4, la aplicacion Normal Probabilities (Probabilidades Normales) se usa 
para calcular la probabilidad de que cualquier variable aleatoria normalmente distribuida, 
especificada por el usuario, caiga en cualquier intervalo especificado. Tambien proporciona 
una grafica de la funcion de densidad normal seleccionada y un refuerzo visual del hecho de 
que las probabilidades asociadas con cualquier variable aleatoria normalmente distribuida son 
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F I G U R A 1 
llustracion de una 
aplicacion breve de 
la regia de Bayes 



P(B)= 0.0100 P(A|B)= 0.9000 P(A|~B)= 0.1000 


equivalentes a probabilidades asociadas con la distribucion normal estandar. La aplicacion 
Normal Probabilities (One Tail) (Probabilidades Normales (Una Cola)) proporciona areas de 
cola superior asociadas con cualquier distribucion normal, especificada por el usuario y tam- 
bien se puede usar para establecer el valor que corta un area, especificada por un usuario, en 
la cola superior para cualquier variable aleatoria normalmente distribuida. Las probabilidades 
y cuantiles asociados con variables aleatorias normales estandar se obtienen al seleccionar la 
media de valores de parametro = 0 y desviacion estandar = 1. Las distribuciones beta y gamma 
se exploran mas a fondo en este capftulo. Los usuarios pueden al mismo tiempo graficar tres 
densidades gamma (o beta) (todas con valores de parametros seleccionados por el usuario) y 
evaluar el impacto que los valores de parametro tienen en las formas de funciones de densidad 
gamma (o beta) (vea Figura 2). Esto se logra con el uso de las aplicaciones breves Comparison 


FIGURA 2 
Comparacion de 
aplicacion breve 
de tres densidades 
beta 
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of Gamma Density Functions and Comparison of Beta Density Functions, (Comparacion de 
Funciones de Densidad Gamma y Comparacion de Funciones de Densidad Beta), respec- 
tivamente. Las probabilidades y cuantiles asociados con variables aleatorias de distribucion 
gamma y beta se obtienen usando las aplicaciones Gamma Probabilities and Quantiles or 
Beta Probabilities and Quantiles (Probabilidades y Cuantiles Gamma o Probabilidades y 
Cuantiles Beta). Se proporcionan conjuntos de Ejercicios de Aplicaciones Breves para guiar 
al usuario a descubrir resultados interesantes e informativos asociados con variables aleatorias 
de distribucion normal, beta y gamma (incluyendo las exponenciales y de yf). Mantenemos 
el enfasis en la distribucion yf, incluyendo algunos resultados teoricos que son utiles en el 
posterior desarrollo de las distribuciones tyF. 

En el Capltulo 5 se deja claro que las densidades condicionales no estan definidas para 
valores de la variable condicionante donde la densidad marginal es cero. Tambien hemos re- 
tenido el analisis de la “varianza condicional” y su uso para hallar la varianza de una variable 
aleatoria. Brevemente se estudian modelos jerarquicos. Al igual que en la edicion anterior, el 
Capltulo 6 introduce el concepto del apoyo de una densidad y resalta que se puede usar un me- 
todo de transformacion cuando esta es monotona en la region de apoyo. El metodo jacobiano 
esta incluido para la implementacion de una transformacion bivariada. 

En el Capltulo 7, la aplicacion breve Comparison of Student’s t and Nonnal Distributions 
(Comparacion de Distribuciones t de Student y Normales) permite la visualizacion de simi¬ 
litudes y diferencias en funciones de densidad t y estandar normal y las aplicaciones bre¬ 
ves Probabilidades y Cuantiles Ji cuadrada, Probabilidades y Cuantiles t de Student y las 
Probabilidades y Cuantiles de Razon F proporcionan probabilidades y cuantiles asociados 
con las distribuciones respectivas, todos con grados de libertad especificados por el usuario. 
La aplicacion breve DiceSample utiliza el conocido ejemplo de lanzar dados a una mesa para 
introducir el concepto de una distribucion de muestreo. Los resultados para diferentes tama¬ 
nos muestrales permiten al usuario evaluar el impacto del tamano de la muestra en la distribu¬ 
cion muestral de la media. La aplicacion breve tambien permite la visualizacion de la forma 
en que la distribucion muestral es afectada si el dado no esta balanceado. Bajo el encabezado 
general de “Distribuciones Muestrales y el Teorema del Llmite Central”, cuatro aplicaciones 
breves diferentes ilustran conceptos diferentes: 

• Bdsica ilustra que, cuando se muestrea de una poblacion normalmente distribuida, la 
media muestral esta normalmente distribuida. 

• TamanoMuestral exhibe el efecto del tamano de la muestra en la distribucion mues¬ 
tral de la media. La distribucion muestral para dos tamanos muestrales (seleccionados 
por el usuario) son generados y mostrados simultaneamente uno al lado del otro. Las 
similitudes y diferencias de las distribuciones muestrales se hacen evidentes. Pueden 
generarse muestras de poblaciones con distribuciones “normales”, uniformes, en forma 
de U y sesgadas. Las distribuciones asociadas que aproximan un muestreo normal pue¬ 
den recubrirse en las distribuciones simuladas resultantes, permitiendo una inmediata 
evaluacion visual de la calidad de la aproximacion normal (vea Figura 3). 

• La Varianza Simula la distribucion muestral de la varianza muestral cuando se muestrea 
de una poblacion con una distribucion “normal”. La distribucion teorica (proporcional a 
la de una variable aleatoria yf ) puede recubrirse con el clic de un boton, dando de nuevo 
confirmacion visual de que la teorfa realmente funciona. 

• El Tamano de Varianza permite una comparacion del efecto del tamano muestral sobre 
la distribucion de la varianza muestral (de nuevo, el muestreo de una poblacion normal). 
La densidad teorica asociada puede recubrirse para ver que la teorfa realmente funcio¬ 
na. Ademas, se ve que para grandes tamanos muestrales la varianza muestral tiene una 
distribucion normal aproximada. 
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F I G U R A 3 
llustracion de 
Aplicacion Breve del 
teorema de I finite 
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Distribucion: 


En forma de U 


3 


Tamafio muestral: 


A seleccionar abajo 


Poblacion: M= 16.S0 S= 11.52 




Tamafio muestral: 




c 


1 muestra 


DC 


1000 muestras 


D< 


Alternancia normal 


Restablecer 


La aplicacion Normal Approximation to the Binomial (Aplicacion Normal a la Binomial) 
permite al usuario evaluar la calidad de la aproximacion normal (continua) para probabilida- 
des binomiales (discretas). Al igual que en capitulos anteriores, una secuencia de ejercicios de 
aplicacion breve (applet) lleva al usuario a descubrir importantes e interesantes respuestas y 
conceptos. Desde un punto de vista mas teorico, establecemos la independencia de la media 
muestral y varianza muestral para una muestra de tamano 2 desde una distribucion normal. 
Como antes, la prueba de este resultado para n general esta contenida en un ejercicio opcio- 
nal. Los ejercicios contienen deducciones paso a paso de la media y varianza para variables 
aleatorias con distribuciones t y F. 

En todo el Capitulo 8 hemos resaltado las suposiciones asociadas con intervalos de confian- 
za basados en las distribuciones t. Tambien hemos incluido un breve examen de la robustez de 
los procedimientos t y la falta de estos para los intervalos basados en las distribuciones % 2 y F. 
La aplicacion Confidencelnten’alP ( IntervalodeConfianzaP) ilustra propiedades de intervalos 
de confianza con muestras grandes para una proporcion de poblacion. En el Capitulo 9, las 
aplicaciones PointSingle, PointbyPoint J y PointEstimation en ultima instancia llevan a una 
ilustracion muy interesante de convergencia en probabilidad. En el Capitulo 10, la aplicacion 
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Hypotesis Testing (for Proportions) ilustra conceptos importantes asociados con pruebas de 
hipotesis que incluyen lo siguiente: 

• ( ',Que es lo que exactamente significa al 

• Pruebas basadas en tamanos de muestra mas grande por lo general tienen probabilida- 
des mas pequenas de cometer errores tipo II si el nivel de las pruebas permanece fijo. 

• Para un tamano muestral fijo, la funcion de potencia aumenta cuando el valor del para- 
metro se mueve mas desde los valores especificados por la hipotesis nula. 

Una vez que los usuarios visualicen estos conceptos, los subsiguientes desarrollos teoricos 
son mas importantes y significativos. Las aplicaciones para las distribuciones yf, r, y F se 
usan para obtener valores p exactos para pruebas asociadas de hipotesis. Tambien ilustramos 
de manera explfcita que la potencia de una prueba uniformemente mas poderosa puede ser 
menor ( aun cuando es la mas grande posible) de lo que se desea. 

En el Capitulo 11, el modelo de regresion lineal simple se analiza en su totalidad (inclu- 
yendo intervalos de confianza, intervalos de prediction, y correlation) antes de introducir 
el metodo matricial al modelo de regresion lineal multiple. Las aplicaciones Fitting a Line 
Using Least Squares y Removing Points from Regression ilustran que se logra el criterio de 
mmimos cuadrados y que unos cuantos puntos de informacion poco comunes pueden tener un 
considerable impacto en la linea de regresion ajustada. Los coeficientes de determinacion y 
determinacion multiple se introducen, analizan y relacionan con las estadfsticas ty F relevan- 
tes. Los ejercicios demuestran que los coeficientes altos (bajos) de valores de determinacion 
(multiples) no necesariamente corresponden a resultados que sean estadfsticamente significa¬ 
tivos (insignificantes). 

El Capitulo 12 incluye una section separada sobre el experimento de observaciones parea- 
das. Aunque se pueden usar numerosos conjuntos posibles de variables ficticias para llevar 
el analisis de varianza en un contexto de regresion, en el Capitulo 13 nos concentramos en 
las variables ficticias que por lo general se emplean en el SAS y otros paquetes de computo 
de analisis estadistico. El texto todavia se concentra basicamente en el diseno de bloques 
aleatorizado con efectos de bloque (no aleatorios). Si el profesor asi lo desea, se puede usar 
una serie de ejercicios complementarios que se refieren al diseno de bloques aleatorizado con 
efectos de bloque aleatorio, para ilustrar las similitudes y diferencias de estas dos versiones 
del diseno de bloques aleatorizado. 

El nuevo Capitulo 16 contiene una breve introduction a metodos de Bayes de inferencia 
estadistica. El capitulo se concentra en el uso de datos y la distribution previa para obtener 
la posterior y en el uso de la posterior para obtener estimaciones, intervalos de credibilidad y 
pruebas de hipotesis para parametros. La aplicacion Binomial Revision (Revision Binomial) 
facilita la comprension del proceso por el que se usa informacion para actualizar la previa y 
obtener la posterior. Muchas de las distribuciones posteriores son distribuciones beta o gamma 
y las aplicaciones ya antes estudiadas son instrumentos para obtener intervalos de credibilidad 
o para calcular la probabilidad de varias hipotesis. 


Los ejercicios 

Esta edition contiene mas de 350 nuevos ejercicios, muchos de los cuales usan las aplicacio¬ 
nes previamente citadas para guiar al usuario por una serie de pasos que llevan a mas com¬ 
prension de conceptos importantes. Otros usan las aplicaciones breves (applets) para obtener 
intervalos de confianza o valores p que pudieran solo aproximarse con el uso de tablas del 
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apendice. En la misma forma que en ediciones previas, parte de los nuevos ejercicios son 
teoricas mientras que otros contienen informacion de fuentes documentadas que se refieren a 
investigaciones realizadas en varios campos. Seguimos pensando que los ejercicios basados 
en datos reales, o en situaciones experimentales reales, permiten que el estudiante vea los usos 
practicos de los diversos metodos estadfsticos y de probabilfstica presentados en el texto. A1 
resolver estos ejercicios, los estudiantes adquieren conocimientos de aplicaciones reales de 
los resultados teoricos desarrollados en el texto. Este conocimiento hace que el aprendizaje 
de la teorfa necesaria se disfrute mas y produzca una mas profunda comprension de los meto¬ 
dos teoricos. A1 igual que en ediciones previas, los ejercicios de grado de dificultad mas alto 
estan marcados con un asterisco (*). Las respuestas a los ejercicios de numero impar aparecen 
al final del libro. 


Tablas y apendice 

Hemos conservado el uso de tablas normales de cola superior porque los usuarios del texto las 
encuentran mas comodas. Tambien hemos conservado el formato de la tabla de las distribucio- 
nes F que introdujimos en ediciones anteriores. Esta tabla de las distribuciones F dan valores 
criticos correspondientes a areas de cola superior de .100, .050, .025, .010 y .005 en una sola 
tabla. Como las pruebas basadas en estadfsticos que poseen la distribucion F se presentan con 
mucha frecuencia, esta tabla facilita el calculo de niveles de significancia alcanzados, o valo¬ 
res p, asociados con valores observados de estos estadfsticos. 

Tambien hemos continuado nuestra practica de dar facil acceso a informacion que se usa 
con frecuencia. Debido a que las tablas t y normales son las tablas estadfsticas que se usan 
con mas frecuencia en el texto, en el Apendice 3 del texto se dan copias de estas tablas. Los 
usuarios de ediciones anteriores con frecuencia nos han hablado favorablemente de la utili- 
dad de tablas de las distribuciones comunes de probabilidad, medias, varianzas y funciones 
generadoras de momento dadas en el Apendice 2 del libro. Ademas, en un suplemento al 
Apendice 1 hemos incluido algunos resultados matematicos que se usan con frecuencia. Estos 
resultados incluyen la expansion binomial de (x + y)", la expansion serie de A, sumas de se¬ 
ries geometricas, defmiciones de las funciones gamma y beta, y asf sucesivamente. Al igual 
que antes, cada capftulo se inicia con un resumen que contiene los tftulos de las principales 
secciones de ese capftulo. 
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NOTA AL ESTUDIANTE 


Como lo sugiere el tftulo de EstacUstica matematica con aplicaciones, este libro se refiere a 
estadfsticas, en teorfa y aplicaciones, y solo contiene matematicas como una herramienta ne- 
cesaria para dar al estudiante una firme comprension de tecnicas estadfsticas. Las siguientes 
sugerencias para usar el texto aumentaran el aprendizaje y ahorraran tiempo. 

La conectividad del libro esta dada por las introducciones y resumenes de cada capftulo. 
Estas secciones explican la forma en que cada capftulo se ajusta en la imagen general de la 
inferencia estadfstica y como es que cada capftulo se relaciona con los precedentes. 


FIGURA 4 
Calculo de aplica- 
cion breve de la pro- 
babilidad de que una 
variable aleatoria de 
distribucion gamma 
excede de su media 


alpha: 3.2 beta: 4.6875 



15.00000 Prob: 0.42562 


x: 




xxii Nota al estudiante 


Dentro de los capitulos, se ponen de relieve importantes conceptos como definiciones. 
Estas deben ser leidas varias veces hasta que sean entendidas con toda claridad porque forman 
la estructura sobre la que se construye todo lo demas. Los principales resultados teoricos se 
destacan como teoremas. Aun cuando no es necesario entender la prueba de cada uno de los 
teoremas, una clara comprension del significado e implicaciones de estos es esencial. 

Tambien es fundamental que el estudiante trabaje muchos de los ejercicios, al menos por 
cuatro razones: 

• El lector puede estar seguro que entiende lo que ha leido solo si pone su conocimiento 
a prueba en problemas de trabajo. 

• Muchos de los ejercicios son de una naturaleza practica y arrojan luz sobre las aplica- 
ciones de probabilidad y estadistica. 

• Algunos de los ejercicios presentan nuevos conceptos y asi amplfan el material cubierto 
en el capitulo. 

• Muchos de los ejercicios de aplicaciones breves ayudan a aumentar la intuicion, facilitar 
la comprension de conceptos y dar respuestas que no pueden (practicamente) obtenerse 
con el uso de las tablas de los apendices (vea la Figura 4). 


D. D. W. 

W. M. 
R. L. S. 
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^Que es estadfstica? 


1.1 Introduccion 

1.2 Caracterizacion de un conjunto de mediciones: metodos graficos 

1.3 Caracterizacion de un conjunto de mediciones: metodos numericos 

1.4 Forma en que se hacen inferencias 

1.5 Teorfa y realidad 

1.6 Resumen 

Bibliograffa y lecturas adicionales 


1.1 Introduccion 

Se emplean tecnicas estadisticas en casi todas las fases de la vida. Se disenan encuestas para 
recabar los primeros informes en un dia de elecciones y pronosticar el resultado de una elec- 
cion. Se hacen muestreos de consumidores para obtener informacion para predecir preferen- 
cias de productos. Medicos investigadores realizan experimentos para determinar el efecto de 
diversos medicamentos y condiciones ambientales controladas en seres humanos para inferir 
el tratamiento adecuado para varias enfermedades. Los ingenieros muestrean la caracterfstica 
de calidad de un producto y diversas variables de procesos controlables para identificar va¬ 
riables clave relacionadas con la calidad de un producto. Aparatos electronicos recien manu- 
facturados se muestrean antes de enviarlos para decidir si se embarcan o se mantienen lotes 
individuates. Los economistas observan varios indices del estado de la economia en un pe- 
riodo y usan la informacion para pronosticar las condiciones de la economia en el futuro. Las 
tecnicas estadisticas desempenan un importante papel para alcanzar la meta de cada una de 
estas situaciones practicas. El perfeccionamiento de la teorfa que sirve de base a estas tecnicas 
es el objetivo de este texto. 

Un requisito previo para un examen de la teorfa de estadistica es una definition de estadfstica 
y un enunciado de sus objetivos. El Webster’s New Collegiate Dictionary define estadistica 
como “rama de las matematicas que estudia la recoleccion, analisis, interpretacion y presen¬ 
tation de masas de informacion numerica”. Stuart y Ord (1991) expresan: “Estadistica es la 
rama del metodo cientifico que estudia los datos obtenidos por contar o medir las propiedades 
de poblaciones”. Rice (1995), comentando sobre experimentation y aplicaciones estadisticas, 
expresa que la estadistica se “ocupa esencialmente de procedimientos para analizar infor¬ 
macion, en especial aquella que en algun sentido vago tenga un caracter aleatorio”. Freund 
y Walpole (1987), entre otros, ven la estadistica como una disciplina que abarca “la ciencia 
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de basar inferencias en datos observados y todo el problema de tomar decisiones frente a una 
incertidumbre”. Y Mood, Graybill y Boes 1974) definen la estadfstica como “la tecnologfa del 
metodo cientffico” y agregan que la estadfstica se ocupa de “(1) el diseno de experimentos e 
investigaciones, (2) inferencia estadfstica”. Un examen superficial de estas definiciones sugie- 
re una falta importante de acuerdo, pero todas poseen elementos comunes. Cada description 
implica que los datos se recolectan, con la inferencia como objetivo. Cada una requiere selec- 
cionar un subconjunto de un gran conjunto de datos, ya sea existente o conceptual, para inferir 
las caracterfsticas del conjunto complete. Todos los autores implican que la estadfstica es una 
teoria de informacion, siendo la inferencia su objetivo. 

La gran recopilacion de datos que es el objetivo de nuestro interes se denomina poblacion, 
y el subconjunto seleccionado de ella es una muestra. Las preferencias del electorado para 
un candidato gubernamental, Jones, expresadas en forma cuantitativa (1 por “prefieren” y 0 
para “no prefieren”) dan una poblacion real, finita y existente de gran interes para Jones. Para 
determinar la verdadera fraccion que esta a favor de elegirlo, Jones necesitarfa entrevistar a 
todo el electorado, trabajo que es practicamente imposible. El voltaje en un punto particular 
en el sistema de gufa para una nave espacial puede probarse en los linicos tres sistemas que 
se han construido. Los datos resultantes podrfan usarse para estimar las caracterfsticas de 
voltaje para otros sistemas que podrfan manufacturarse en el futuro. En este caso, la poblacion 
es conceptual. Consideramos que la muestra de tres es representativa de una gran poblacion 
de sistemas de gufa que podrfan construirse usando el mismo metodo. Presumiblemente, esta 
poblacion tendrfa caracterfsticas similares a los tres sistemas de la muestra. Del mismo modo, 
las mediciones en los pacientes para un experimento medico representan una muestra de una 
poblacion conceptual formada por todos los pacientes que de modo semejante sufren hoy, asf 
como los que estaran afectados en el futuro proximo. El lector encontrara util definir con cla- 
ridad las poblaciones de interes para cada una de las situaciones descritas antes en esta section 
y para aclarar la meta inferencial para cada una. 

Es interesante observar que la industria y el gobierno de Estados Unidos gastan miles de 
millones de dolares cada ano en busca de datos de experimentos, encuestas de muestreo y otros 
procedimientos de recoleccion de datos. Este dinero se gasta solo para obtener informacion 
acerca de fenomenos susceptibles de medir en el ramo de finanzas, ciencias o las artes. Las im- 
plicaciones de esta afirmacion dan la clave para la naturaleza de la muy valiosa aportacion que 
la disciplina de estadfstica hace para la investigation y desarrollo en todos los campos de ac¬ 
tion de la sociedad. La informacion util para inferir alguna caracterfstica de una poblacion (ya 
sea existente o conceptual) se compra en una cantidad especificada y resulta en una inferencia 
(estimation o decision) con un grado de bondad asociado. Por ejemplo, si Jones hace arreglos 
para entrevistar una muestra de votantes, la informacion de la muestra se puede emplear para 
estimar la verdadera fraccion de todos los votantes que estan a favor de la eleccion de Jones. 
Ademas de la estimacion, Jones debe estar interesado en la probabilidad (posibilidad) de que 
la estimacion proporcionada sea cercana a la verdadera fraccion de votantes elegibles que es¬ 
tan a favor de su eleccion. De manera intuitiva, cuanto mayor sea el numero de votantes elegi¬ 
bles de la muestra mayor sera la probabilidad de una estimacion precisa. Del mismo modo, si 
una decision se toma con respecto a meritos relativos de dos procesos de manufactura basados 
en el examen de muestras de productos provenientes de ambos procesos, deberfamos estar 
interesados en la decision respecto a cual es mejor y en la probabilidad de que la decision sea 
correcta. En general, el estudio de la estadfstica se ocupa del diseno de experimentos o encues¬ 
tas muestrales para obtener una cantidad especificada de informacion al mfnimo costo y del 
optimo uso de esta informacion al hacer una inferencia acerca de una poblacion. La meta de 
la estadfstica es hacer una inferencia acerca de una poblacion, con base en informacion 
contenida en una muestra de esa poblacion y dar una medida de bondad asociada para la 
inferencia. 
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Ejercicios 

1.1 Para cada una de las siguientes situaciones, identifique la poblacion de interes, la meta inferencial y diga 

como emprenderia la recoleccion de una muestra. 

a Un investigador universitario desea estimar la proportion de ciudadanos estadounidenses de la “ge¬ 
neration X” que estan interesados en iniciar sus propios negocios. 

b Durante mas de un siglo, la temperatura corporal normal en seres humanos ha sido aceptada como 
37°C. ^Es as! realmente? Los investigadores desean estimar el promedio de temperatura de adultos 
sanos en Estados Unidos. 

c Un ingeniero municipal desea estimar el promedio de consumo semanal de agua para unidades habi- 
tacionales unifamiliares en la ciudad. 

d El National Highway Safety Council desea estimar la proportion de llantas para automovil con dibu- 
jo o superficie de rodadura insegura, entre todas las llantas manufacturadas por una empresa especf- 
fica durante el presente ano de production. 

e Un politologo desea estimar si la mayorfa de los residentes adultos de un estado estan a favor de una 
legislatura unicameral. 

f Un cientffico del area medica desea estimar el tiempo promedio para que se vuelva a presentar cierta 
enfermedad. 

g Un ingeniero electricista desea determinar si el promedio de vida util de transistores de cierto tipo es 
mayor que 500 horas. 


1.2 Caracterizacion de un conjunto de mediciones: 
metodos graficos 

En el sentido mas amplio. hacer una inferencia implica describir en forma partial o completa 
un fenomeno o un objeto ffsico. Se encuentra poca dificultad cuando se dispone de medicio- 
nes descriptivas apropiadas y significativas, pero este no es siempre el caso. Por ejemplo, 
podriamos caracterizar una persona si usamos su estatura, peso, color de cabello y ojos, asf 
como otras mediciones descriptivas de la fisonomfa de la persona. Identificar un conjunto 
de mediciones descriptivas para caracterizar una pintura al oleo sobre tela serfa un trabajo 
comparativamente mas diffcil. Caracterizar una poblacion formada por un conjunto de medi¬ 
ciones es tambien muy diffcil. En consecuencia, un preludio necesario para una discusion de 
hacer inferencias es la adquisicion de un metodo para caracterizar un conjunto de numeros. 
Las caracterizaciones deben ser significativas para que el conocimiento de las mediciones 
descriptivas haga posible que visualicemos con claridad el conjunto de numeros. Ademas, 
requerimos que las caracterizaciones tengan signification practica para que el conocimiento 
de las mediciones descriptivas de una poblacion se pueda usar para resolver un problema prac- 
tico, no estadfstico. Desarrollaremos nuestras ideas sobre este tema al examinar un proceso 
que genera una poblacion. 

Considere un estudio para determinar variables importantes que afectan las utilidades de una 
empresa que fabrica aparatos de maquinado especial o hechos bajo pedido. Algunas de estas 
variables podrfan ser el importe del contrato en dolares, el tipo de industria con la cual se ne- 
gocia el contrato, el grado de competencia para adquirir contratos, el vendedor que estima el 
contrato, costos fijos en dolares y el supervisor a quien se asigna el trabajo de organizar y di- 
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rigir el proceso de fabrication. El experto en estadfstica deseara medir la respuesta o variable 
dependiente, y la utilidad por contrato para varios trabajos (la muestra). Ademas de registrar la 
utilidad, el estadfstico obtendra mediciones sobre las variables que podrfan estar relacionadas 
con la utilidad, las variables independientes. El objetivo de el o ella es usar information de la 
muestra para inferir la relacion aproximada entre las variables independientes que acabamos 
de describir y la variable dependiente, la utilidad, y para medir la fuerza de esta relacion. El 
objetivo del fabricante es determinar optimas condiciones para maximizar las utilidades. 

La poblacion de interes del problema de manufactura es conceptual y esta formado por to- 
das las mediciones de utilidades (por unidad de capital y mano de obra invertidos) que podrfan 
hacerse en contratos, ahora y en el futuro, para valores fijos de las variables independientes 
(tamano del contrato, medida de competencia, etc.) Las mediciones de las utilidades van a 
variar de un contrato a otro en una forma aparentemente aleatoria como resultado de variacio- 
nes en materiales, tiempo necesario para completar segmentos individuales del trabajo y otras 
variables no controlables que afectan el trabajo. En consecuencia, vemos la poblacion como 
la representada por una distribution de mediciones de utilidades, con la forma de la distribu¬ 
tion dependiendo de valores especfficos de las variables independientes. Nuestro deseo para 
determinar la relacion entre la variable dependiente, la utilidad y un conjunto de variables in¬ 
dependientes, por tanto, se convierte en un deseo para determinar el efecto de las variables 
independientes en la distribution conceptual de mediciones de poblacion. 

Una poblacion individual (o cualquier conjunto de mediciones) puede estar caracterizada 
por una distribution defrecuencia relativa, que puede estar representada por un histograma de 
frecuencia relativa. Se construye una grafica al subdividir el eje de medicion en intervalos de igual 
ancho. Se construye un rectangulo sobre cada intervalo, de modo que la altura del rectangulo 
sea proporcional a la fraction del mimcro total de mediciones que caen en cada celda. Por 
ejemplo, para caracterizar las diez mediciones 2.1, 2.4, 2.2, 2.3, 2.7, 2.5, 2.4, 2.6, 2.6 y 2.9, 
podrfamos dividir el eje de medicion en intervalos de igual ancho (por ejemplo .2 unidades), 
comenzando con 2.05. Las frecuencias relativas (fraction del numero total de mediciones), 
calculadas para cada intervalo, se muestran en la Figura 1.1. Observe que la figura da una clara 
description grafica de todo el conjunto de las diez mediciones. 

Observe que no hemos dado reglas precisas para seleccionar el numero, anchos o ubicacio- 
nes de los intervalos empleados para construir un histograma. Esto es porque la selection de 
estos elementos esta un poco a discretion de la persona que intervenga en la construction. 

Aun cuando son arbitrarias, unas cuantas gufas pueden ser muy utiles para seleccionar los 
intervalos. Los puntos de subdivision del eje de medicion deben escogerse de modo que sea 
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imposible que una medicion caiga en un punto de division. Esto elimina una fuente de confu¬ 
sion y se obtiene con facilidad, como se indica en la Figura 1.1. La segunda gufa se refiere al 
ancho de cada intervalo y, en consecuencia, al numero mfnimo de intervalos necesarios para 
describir los datos. Dicho en terminos generates, deseamos obtener informacion sobre la for¬ 
ma de la distribucion de los datos. Muchas veces la forma sera como de montfculo, como se 
ilustra en la Figura 1.2. (Otros prefieren referirse a estas distribuciones como forma de campa- 
na o normales.) El uso de numerosos intervalos con una pequena cantidad de datos resulta en 
poco resumen y presenta una imagen muy semejante a los datos en su forma original. Cuanto 
mayor sea la cantidad de datos, el numero de intervalos incluidos puede ser mas grande pero 
al mismo tiempo se presenta una imagen satisfactoria de los datos. Sugerimos abarcar el mar- 
gen de los datos con 5 a 20 intervalos y usar el mayor numero de intervalos para cantidades 
mas grandes de datos. En casi todas las aplicaciones practicas se usan paquetes de software 
(Minitab, SAS, R, S+, JMP, etc.) para obtener cualesquiera histogramas deseados. Estos pa¬ 
quetes de computo producen histogramas que satisfacen restricciones ampliamente genera- 
lizadas sobre las que se han convenido escalas, numero de intervalos empleados, anchos de 
intervalos y otros datos semejantes. 

Algunos estadfsticos piensan que la descripcion de datos es un fin en si misma. Con fre- 
cuencia se emplean histogramas para este proposito, pero hay muchos otros metodos grafi¬ 
cos que dan resumenes significativos de la informacion contenida en un conjunto de datos. 
Algunas excelentes obras de consulta para el tema general de metodos descriptivos graficos 
se dan en la bibliografia que aparece al final de este capitulo. Recuerde, no obstante, que el 
objetivo usual de la estadistica es hacer inferencias. La distribucion de frecuencia relativa aso- 
ciada con un conjunto de datos y el histograma que la acompana son suficientes para nuestros 
objetivos y para desarrollar el material en este texto. Esto se debe principalmente a la interpre¬ 
tation probabilistica que se puede deducir del histograma de frecuencia, Figura 1.1. Ya hemos 
expresado que el area de un rectangulo para un intervalo dado es proporcional a la fraction del 
numero total de mediciones que caen en dicho intervalo. Extendamos esta idea un paso mas. 

Si una medicion se selecciona al azar del conjunto de datos original, la probabilidad de que 
caiga en un intervalo dado es proporcional al area bajo el histograma que se encuentre sobre 
ese intervalo. (En este punto nos apoyamos en el concepto de probabilidad del lego. Este ter- 
mino se examina con mayor detalle en el Capitulo 2.) Por ejemplo, para los datos empleados 
para construir la Figura 1.1, la probabilidad de que una medida seleccionada al azar caiga en 
el intervalo de 2.05 a 2.45 es .5 porque la mitad de las mediciones caen en este intervalo. De 
manera correspondiente, el area bajo el histograma de la Figura 1.1 sobre el intervalo de 2.05 
a 2.45 es la mitad del area total bajo el histograma. Es claro que esta interpretation se aplica a 
la distribucion de cualquier conjunto de mediciones, es decir, una poblacion o una muestra. 

Suponga que la Figura 1.2 da la distribucion de frecuencia relativa de utilidades (en mi- 
llones de dolares) para una poblacion conceptual de respuestas de utilidades para contratos 


FIGURA 1.2 
Distribucion de fre¬ 
cuencia relativa 
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en situaciones especlficas de las variables independientes (tamano de contrato, medida de 
competencia, etc.). La probabilidad de que el siguiente contrato (en las mismas situaciones de las 
variables independientes) de una utilidad que caiga en el intervalo de 2.05 a 2.45 millones 
esta dada por la proporcion del area bajo la curva de distribution que esta sombreada en la 
Figura 1.2. 


Ejercicios 

1.2 ^Algunos poblados son mas ventosos que otros? ^Chicago merece el apodo de “la Ciudad de los 
Vientos”? A continuation aparece el promedio de velocidades del viento (en millas por hora) para 45 
ciudades seleccionadas de Estados Unidos: 
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Fuente: The World Almanac and Book of Facts, 2004. 


a Construya un histograma de frecuencia relativa para estos datos. (Seleccione las fronteras de clase sin 
incluir el valor de 35.1 en el intervalo de valores.) 

b El valor 35.1 se registro en Mt. Washington, New Hampshire. ^La geografra de esa ciudad explica la 
magnitud promedio de la velocidad de sus vientos? 

c El promedio de velocidad de vientos en Chicago es 10.3 millas por hora. ^Que porcentaje de las 
ciudades tienen promedios de velocidad de vientos mayores que Chicago? 
d ^.Piensa usted que Chicago tiene vientos inusuales? 


1.3 De gran importancia para residentes de la region central de Florida es la cantidad de material radiactivo 
presente en el suelo de zonas recuperadas de la explotacion minera de fosfatos. Las mediciones de la 
cantidad de 238 U en 25 muestras de suelo fueron como sigue (mediciones en picocurios por gramo): 
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Construya un histograma de frecuencia relativa para estos datos. 

1.4 Las 40 acciones principales del mercado secundario (OTC, por sus siglas en ingles), clasificadas por el 
porcentaje de acciones en circulation vendidas en un dfa el ano pasado son como sigue: 
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a Construya un histograma de frecuencia relativa para describir estos datos. 

b (,Que proporcion de estas 40 acciones principales vendio mas de 4% de las acciones en circula¬ 
cion? 


Ejercicios 7 


C Si una de las acciones se selecciona al azar de las 40 para las que se tomaron los datos precedentes, 
^cual es la probabilidad de que venda menos de 5% de sus acciones en circulation? 

1.5 Aquf damos el histograma de frecuencia relativa asociado con los promedios de puntos de calificacion 
(PPC) de una muestra de 30 estudiantes: 


Frecuencia 

relativa 



Promedio de puntos 
de calificacion 


a ^Cuales de las categorfas de PPC identificadas en el eje horizontal estan asociadas con la proporcion 
mas grande de estudiantes? 

b ^Que proporcion de estudiantes tuvo PPC en cada una de las categorfas que identificamos? 
c ^Que proporcion de los estudiantes tuvo PPC menores que 2.65? 

1.6 El histograma de frecuencia relativa que aparece a continuation se construyo a partir de datos obtenidos 
de una muestra aleatoria de 25 familias. A cada una se le pregunto el numero de cuartos de galon de 
leche que habfan comprado la semana previa. 


Frecuencia 

relativa 



0 12 3 4 5 


Cuartos 


a Use este histograma de frecuencia relativa para determinar el numero de cuartos de leche comprados 
por la proporcion mas grande de las 25 familias. La categorfa asociada con la frecuencia relativa mas 
grande se denomina categoria modal. 
b f,Que proporcion de las 25 familias compro mas de 2 cuartos de leche? 
c f,Que proporcion compro mas de 0 pero menos de 5 cuartos? 
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1.7 Las estaturas, declaradas por 105 estudiantes de un grupo de bioestadfstica se emplearon para construir 
el histograma que aparece a continuacion. 



Estaturas 

a Describa la forma del histograma. 
b ^Este histograma dene una caracterfstica poco comun? 

c ^Puede el lector dar una explicacion acerca de los dos picos del histograma? ^Hay alguna considera¬ 
tion ademas de la estatura que resulta en los dos picos separados? ^,Cual es? 

1.8 Un artfculo en Archaeometry presento un analisis de 26 muestras de ceramica romano-britanica hallada 
en cuatro hornos en sitios diferentes del Reino Unido. El porcentaje de oxido de aluminio en cada una 
de las 26 muestras aparece a continuacion: 

Llanederyn Caldicot Island Thoms Ashley Rails 
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10.9 12.7 

10.1 12.5 

Fuente: A. Tubb, A. J. Parker y G. Nickless, “The Analysis of Romano-British Pottery by Atomic Absorption 
Spectrophotometry”, en Archaeometry 22 (1980): 153. 

a Construya un histograma de frecuencia relativa para describir el contenido de oxido de aluminio de 
las 26 muestras de ceramica. 

b (,Q U ® caracterfstica poco comun observa el lector en este histograma? A1 ver los datos, ^puede dar 
una explicacion de esta caracterfstica poco comun? 

1.3 Caracterizacion de un conjunto de mediciones: 
metodos numericos 

Los histogramas de frecuencia relativa presentados en la Seccion 1.2 dan information util res- 
pecto de la distribucion de conjuntos de medicion, pero los histogramas no suelen ser adecua- 
dos para el proposito de hacer inferencias. De hecho, numerosos histogramas similares podrfan 






































1.3 Caracterizacion de un conjunto de mediciones: metodos numericos 9 


DEFINICION 1.1 


FIGURA 1.3 
Distribuciones de 
frecuencia con igua- 
les medias pero con 
diferentes cantidades 
de variacion 


formarse a partir del mismo conjunto de mediciones. Para hacer inferencias acerca de una pobla- 
cion basadas en informacion contenida en una muestra y para medir la bondad de las inferencias, 
necesitamos cantidades rigurosamente definidas para resumir la informacion contenida en una 
muestra. Estas cantidades muestrales por lo general tienen propiedades matematicas, que se 
desarrollaran en capitulos siguientes, que nos permiten hacer enunciados de probabilidad con 
respecto a la bondad de nuestras inferencias. 

Las cantidades que definimos son mediclas descriptivas numericas de un conjunto de datos. 
Buscamos algunos numeros que tienen interpretaciones significativas y que se pueden usar 
para describir la distribucion de frecuencia de cualquier conjunto de mediciones. Centraremos 
nuestra atencion en dos tipos de numeros descriptivos: medidas de tendencia central y medi- 
das de dispersion o variacion. 

Es probable que la medida de tendencia central mas comun empleada en estadfstica sea la 
media aritmetica. (Debido a que este es el unico tipo de media que estudiamos en este texto, 
omitiremos la palabra aritmetica.) 

La media de una muestra de n respuestas medidas y v y 2 ,... ,y n esta dada por 



La media poblacional correspondiente se denota como p. 

El simbolo y , que se lee “y barra”, se refiere a una media muestral. Por lo general no pode- 
mos medir el valor de la media poblacional, p; mas bien, p es una constante desconocida que 
podemos estimar usando informacion muestral. 

La media de un conjunto de mediciones solo localiza el centra de la distribucion de datos, 
por si misma no proporciona una descripcion adecuada de un conjunto de mediciones. Dos 
conjuntos de mediciones podrian tener distribuciones de frecuencia muy diferentes pero iguales 
medias, como se ve en la Ligura 1.3. La diferencia entre las distribuciones I y II de la figura se 
encuentra en la variacion o dispersion de las mediciones que estan a lado y lado de la media. 
Para describir en forma adecuada los datos, tambien debemos definir medidas de la variabi- 
lidad de datos. 

La medida de variabilidad mas comun empleada en estadfstica es la varianza, que es una 
funcion de las desviaciones (o distancias) de las mediciones muestrales desde la media. 


DEFINICION 1.1 


FIGURA 1.3 
Distribuciones de 
frecuencia con igua¬ 
les medias pero con 
diferentes cantidades 
de variacion 
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DEFINICION 1.2 


La varianza de una muestra de mediciones y v y 2 ,y n es la suma del cuadrado de las 
diferencias entre las mediciones y su media, dividida entre n - 1. Simbolicamente, la 
varianza muestral es 


* 2 = 




La correspondiente varianza poblacional esta denotada por el sfmbolo cr 2 . 


Observe que dividimos entre n— 1 en lugar de entre n en nuestra definicion de s 1 . La razon 
teorica para esta election de divisor se encuentra en el Capftulo 8, donde demostraremos que s 2 
definida en esta forma proporciona un “mejor” estimador para la verdadera varianza de la po- 
blacion, cr 2 . No obstante, es util considerar a s 2 como “casi” el promedio del cuadrado de las 
desviaciones de los valores observados desde su media. Cuanto mayor sea la varianza de un 
conjunto de mediciones, mayor sera la cantidad de variation dentro del conjunto. La varianza 
es de valor al comparar la variation relativa de dos conjuntos de mediciones, pero proporciona 
information acerca de la variation en un solo conjunto unicamente cuando se interpreta en 
terminos de la desviacion estandar. 


DEFINICION 1.3 


La desviacion estandar de una muestra de mediciones es la rafz cuadrada positiva de la 
varianza; esto es, 

s = \ /j 2 . 

La correspondiente desviacion estandar poblacional esta denotada por cr = Vcr 2 . 


Aun cuando esta estrechamente relacionada con la varianza, la desviacion estandar se puede 
usar para dar una imagen mas o menos precisa de la variation de datos para un solo conjunto 
de mediciones. Se puede interpretar usando el teorema de Tchebysheff (que se estudia en el 
Ejercicio 1.32 y se presentara formalmente en el Capftulo 3) y por la regia empfrica (que ahora 
explicamos). 

Muchas distribuciones de datos de la vida real tienen forma de montfculo; esto es, se pue- 
den aproximar por medio de una distribution de frecuencia en forma de campana conocida 
como curva normal. Los datos que poseen distribuciones en forma de montfculo tienen carac- 
terfsticas definidas de variation, como se expresa en el enunciado siguiente. 


Regia empfrica 

Para una distribution de mediciones que sea aproximadamente normal (forma de cam¬ 
pana), se deduce que el intervalo con puntos extremos 
p±cr contiene aproximadamente 68% de las mediciones. 
p±2cr contiene aproximadamente 95% de las mediciones. 
p ± 3cr contiene casi todas las mediciones. 
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Como se menciono en la Section 1.2, una vez que se conozca la distribucion de frecuencia 
de un conjunto de mediciones, se pueden hacer enunciados de probabilidad respecto de las 
mediciones. Estas probabilidades se mostraron como areas bajo un histograma de frecuencia. 
En forma analoga, las probabilidades especificadas en la regia empirica son areas bajo la curva 
normal mostrada en la Figura 1.4. 

El uso de la regia empirica se ilustra mediante el siguiente ejemplo. Suponga que se sabe 
que las calificaciones en un examen vocacional aplicado a todos los estudiantes de ultimo ano 
de preparatoria en un estado tienen, aproximadamente, una distribucion normal con media 
/i= 64 y desviacion estandar cr = 10. Entonces se puede deducir que aproximadamente 68% de 
las calificaciones estan entre 54 y 74, que aproximadamente 95% de las calificaciones estan 
entre 44 y 84 y que casi todas las calificaciones estan entre 34 y 94. Asi, el conocimiento de la 
media y la desviacion estandar nos da una imagen mas o menos buena de la distribucion de 
frecuencia de las calificaciones. 

Supongamos que se elige al azar un solo estudiante de preparatoria entre los que hicieron 
el examen. ( : Cual es la probabilidad de que su resultado este entre 54 y 74? Basandonos en la 
regia empirica, encontramos que 0.68 es una respuesta razonable a esta pregunta de probabi¬ 
lidad 

La utilidad y valor de la regia empirica se deben a la ocurrencia comun de distribuciones 
aproximadamente normales de datos en la naturaleza, aun mas porque la regia se aplica a 
distribuciones que no son exactamente normales pero si en forma de monticulo. El estudiante 
encontrara que aproximadamente 95% de un conjunto de mediciones estara dentro de 2a de 
jjL para una variedad de distribuciones. 


Ejercicios 

1.9 Los ritmos de respiration en reposo para estudiantes en edad universitaria estan normalmente distribui- 
dos, en forma aproximada, con una media de 12 y desviacion estandar de 2.3 respiraciones por minuto. 
^Que fraction de todos los estudiantes en edad universitaria tienen ritmos de respiration en los interva- 
los siguientes? 

a 9.7 a 14.3 respiraciones por minuto 
b 7.4 a 16.6 respiraciones por minuto 
c 9.7 a 16.6 respiraciones por minuto 
d Menos de 5.1 o mas de 18.9 respiraciones por minuto 

1.10 Se ha proyectado que el promedio y la desviacion estandar del tiempo empleado en llnea usando la Internet 
son, respectivamente, 14 y 17 horas por persona por ano (muchos no usan la Internet en absoluto). 
a iQue valor esta exactamente a 1 desviacion estandar debajo de la media? 

b Si el tiempo empleado en llnea usando la Internet esta normalmente distribuido en forma aproxima¬ 
da, ^,que proportion de los usuarios pasa un tiempo en llnea que es menor al valor hallado en el inciso a? 
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c ^.El tiempo empleado en lfnea, usando la Internet, esta normalmente distribuido en forma aproxima- 
da? ^Por que? 

1.11 Los siguientes resultados en sumatorias nos ayudaran a calcular la varianza muestral s 2 . Para cualquier 
constante c, 

n 

a = nc. 

f=i 

b j 2 c y> =c J 2 yi - 

i=i i=i 

n n n 

c Y^ Xi + yd = 12 Xi + J2 yt - 

i=i i=i i=i 

Use a, b y c para demostrar que 


n — 1 

1.1 2 Use el resultado del Ejercicio 1.11 para calcular s para las n — 6 mediciones muestrales 1, 4, 2, 1, 3 y 3. 

1.13 Consulte el Ejercicio 1.2. 

a Calcule y y s para los datos dados. 

b Calcule el intervalo y ± ks, para k = 1, 2 y 3. Cuente el numero de mediciones que caen dentro de 
cada intervalo y compare este resultado con el numero que usted esperarfa de acuerdo con la regia 
empfrica. 

1.14 Consulte el Ejercicio 1.3 y repita los incisos a y b del Ejercicio 1.13. 

1.15 Consulte el Ejercicio 1.4 y repita los incisos a y b del Ejercicio 1.13. 

1.16 En el Ejercicio 1.4 hay un valor extremadamente grande (11.88). Elimine este valor y calcule y y s para 
las restantes 39 observaciones. Del mismo modo, calcule los intervalos y ± ks para k = 1, 2 y 3; cuente 
el numero de mediciones en cada uno; luego compare estos resultados con los pronosticados por la regia 
empfrica. Compare las respuestas de aquf con las halladas en el Ejercicio 1.15. Considere el efecto de 
una sola observation grande sobre yys. 

1.17 El rango de un conjunto de mediciones es la diferencia entre los valores maximo y mfnimo. La regia 
empfrica sugiere que la desviacion estandar de un conjunto de mediciones puede ser casi aproximada en 
un cuarto de la amplitud (esto es, amplitud/4). Calcule esta aproximacion a i para los conjuntos de datos 
de los Ejercicios 1.2, 1.3 y 1.4. Compare el resultado en cada caso con el valor calculado real de s. 

1.18 Los examenes de aptitud escolar verbales y matematicos del Consejo Universitario se califican en una 
escala de 200 a 800. Parece razonable suponer que la distribution de calificaciones es aproximadamente 
normal para ambos examenes. Use el resultado del Ejercicio 1.17 para calcular la desviacion estandar 
para las calificaciones del examen verbal. 

1.19 De acuerdo con la Environmental Protection Agency, el cloroformo, que en su forma gaseosa es un 
agente cancerfgeno, esta presente en pequenas cantidades en las 240,000 fuentes publicas de agua de 
Estados Unidos. Si la media y la desviacion estandar de las cantidades de cloroformo presentes en las 
fuentes de agua son 34 y 53 microgramos por litro (/u,g/L), respectivamente, explique por que las canti¬ 
dades de cloroformo no tienen una distribution normal. 
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1.4 Forma en que se hacen inferencias 


1.20 Los costos semanales de mantenimiento para una fabrica, registrados en un largo periodo y ajustados a 
la inflation, tienden a tener una distribution aproximadamente normal con un promedio de $420 y una 
desviacion estandar de $30. Si la cantidad de $450 esta presupuestada para la semana proxima, ^cual es 
una probabilidad aproximada de que se rebase esta cantidad presupuestada? 

1.21 El fabricante de un nuevo aditivo de alimento para ganado dice que 80% de los animales alimentados con 
una dieta que incluya este aditivo deben tener un aumento mensual de peso de mas de 20 libras. Una muestra 
grande de mediciones de aumento de peso para ganado alimentado con esta dieta muestra una distri¬ 
bution aproximadamente normal, con media de 22 libras y desviacion estandar de 2 libras. ^Piensa el 
lector que la information muestral contradice lo dicho por el fabricante? (Calcule la probabilidad de un 
aumento de peso mayor que 20 libras.) 


1.4 Forma en que se hacen inferencias 

El mecanismo para hacer inferencias se puede ilustrar bien al analizar nuestros propios proce- 
dimientos intuitivos para hacer inferencias. 

Suponga que dos candidatos compiten para un cargo publico en nuestra comunidad y que 
deseamos determinar si nuestro candidato, Jones, es preferido para ganar. La poblacion de 
interes es el conjunto de respuestas de todos los votantes elegibles que votaran el dfa de la 
election y deseamos determinar si la fraction que apoya a Jones excede de .5. Para mas sim- 
plicidad, suponga que todos los votantes elegibles iran a las urnas y que al azar seleccionamos 
una muestra de 20 de la lista de votantes. Todos ellos fueron entrevistados y todos estan a 
favor de Jones. f,Que concluimos acerca de las posibilidades de Jones para ganar la election? 

Hay poca duda de que casi todos nosotros inferimos de inmediato que Jones ganara. Esta 
es una inferencia facil de hacer, pero no es nuestra meta inmediata. Mas bien, deseamos 
examinar los procesos mentales que se emplearon para llegar a esta conclusion acerca del 
comportamiento esperado de una gran poblacion de votantes basada en una muestra de solo 
20 personas. 

Ganar significa obtener mas de 50% de los votos. ^Concluimos que Jones ganarta porque 
pensamos que la fraction de la muestra que apoya a Jones era identica a la fraction que apo¬ 
ya a Jones en la poblacion? Sabemos que probablemente esto no sea cierto. Un experimento 
sencillo verificara que la fraction de la muestra que apoya a Jones no necesita ser igual que la 
fraction de la poblacion que lo apoya. Si se lanza al aire una moneda, es intuitivamente obvio 
que la verdadera proportion de veces que caiga con la cara hacia arriba es .5, pero si muestreamos 
los resultados de nuestra moneda lanzandola al aire 20 veces, la proportion de caras varia¬ 
nt de una muestra a otra; esto es, en una ocasion podrfamos observar 12 caras de 20 tiros, para 
una proportion de 12/20 = .6. En otra ocasion, podrfamos observar 8 caras en 20 tiros, 
para una proportion muestral de 8/20 = .4. De hecho, la proportion muestral de caras podrfa 
serO, .05, .10, ..., 1.0. 

^Concluimos que Jones ganarta porque serta imposible que 20 de cada 20 votantes mues- 
trales lo apoyaran si de hecho menos de 50% del electorado trato de votar por el? La respuesta 
a esta pregunta es un no rotundo, pero da la clave para nuestra ltnea oculta de logica. No es 
imposible sacar 20 de cada 20 que apoyan a Jones cuando menos de 50% del electorado lo 
apoya, pero es altamente improbable. Como resultado de ello, concluimos que ganarta. 
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Este ejemplo ilustra el importante papel que desempena la probabilidad al hacer inferen- 
cias. Los probabilistas suponen que conocen la estructura de la poblacion de interes y usan 
la teorfa de probabilidad para calcular la probabilidad de obtener una muestra particular. 
Suponiendo que conocen la estructura de una poblacion generada al sacar al azar cinco cartas 
de una baraja, los probabilistas calculan la probabilidad de que el saque dara tres ases y dos 
reyes. Algunos estadisticos usan la probabilidad para hacer el viaje a la inversa, es decir, de la 
muestra a la poblacion. Al observar cinco ases en una muestra de cinco cartas, de inmediato 
infieren que la baraja (que genera la poblacion) esta “cargada” y no es estandar. La probabi¬ 
lidad de sacar cinco ases de una baraja estandar es cero, que es un caso exagerado pero com- 
prueba la idea. Para hacer inferencias es basico el problema de calcular la probabilidad de una 
muestra observada y, en consecuencia, la probabilidad es un mecanismo que se emplea para 
hacer inferencias estadisticas. 

Es oportuno un comentario final. Si usted no penso que la muestra justificaba la inferencia 
de que Jones ganarfa, no se sienta contrariado. Podemos confundirnos facilmente al hacer eva- 
luaciones intuitivas de las probabilidades de eventos. Si usted decidio que la probabilidad era 
muy baja de que 20 votantes de entre 20 estuvieran a favor de Jones, suponiendo que este per- 
diera, tenia razon, pero no es dificil elaborar un ejemplo en el que una evaluation intuitiva de 
probabilidad sea erronea. Las evaluaciones intuitivas de probabilidades no son satisfactorias y 
necesitamos una rigurosa teorfa de probabilidad para desarrollar metodos de inferencia. 


1.5 Teorfa y realidad 

Las teorfas son conjeturas propuestas para explicar fenomenos del mundo real. Como tales, las 
teorias son aproximaciones o modelos de la realidad. Estos modelos o explicaciones de la 
realidad se presentan en forma verbal en algunos campos menos cuantitativos y como re- 
laciones matematicas en otros. Mientras que una teorfa de cambio social podrfa expresarse 
verbalmente en sociologia, una description del movimiento de una cuerda en vibracion se 
presenta de un modo matematico preciso en fisica. Cuando escogemos un modelo matematico 
para un proceso fisico, esperamos que el modelo refleje fielmente, en terminos matematicos, 
los atributos del proceso fisico. Si es asi, el modelo matematico se puede usar para llegar a 
conclusiones acerca del proceso mismo. Si pudieramos desarrollar una ecuacion para predecir 
la position de una cuerda en vibracion, la calidad de la prediction dependeria de lo bien que 
se ajuste la ecuacion al movimiento de la cuerda. El proceso de hallar una buena ecuacion 
no es necesariamente sencillo y por lo general requiere de varias suposiciones de simplifica¬ 
tion (masa uniforme de la cuerda, ausencia de resistencia del aire, etc.). El criterio final para 
decidir si un modelo es “bueno” es si da information buena y util. La motivacion para usar 
modelos matematicos radica esencialmente en su utilidad. 

Este texto se ocupa de la teorfa de estadfstica y por tanto tiene que ver con modelos de la 
realidad. Postularemos distribuciones de frecuencia teoricas para poblaciones y desarrolla- 
remos una teorfa de probabilidad e inferencia de un modo matematico preciso. El resultado 
neto sera un modelo teorico o matematico para adquirir y utilizar informacion de la vida real. 
El modelo no sera una representation exacta en la naturaleza, pero esto no debe molestarnos. 
Su utilidad, como la de otras teorfas, se medira por su capacidad para ayudarnos a entender la 
naturaleza y a resolver problemas del mundo real. 
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1.6 Resumen 

El objetivo de la estadfstica es hacer una inferencia acerca de una poblacion, con base en 
informacion contenida en una muestra tomada de esa poblacion. La teorfa de la estadfstica 
es una teorfa de informacion que se ocupa de cuantificar informacion, disenar experimentos 
o procedimientos para recolectar datos y analizarlos. Nuestra meta es minimizar el costo de 
una cantidad especffica de informacion y usar esta informacion para hacer inferencias. Lo que 
es mas importante es que hemos visto hacer una inferencia acerca de la poblacion descono- 
cida como un procedimiento de dos pasos. Primero, hacemos una lista de un procedimiento 
inferential apropiado para la situation dada. En segundo termino buscamos una medida de la 
bondad de la inferencia resultante, Por ejemplo, toda estimation de una caracterfstica de pobla¬ 
cion basada en informacion contenida en la muestra podrfa tener asociado con ella un lfmite 
probabilfstico en el error de estimation. 

Un preludio necesario para hacer inferencias acerca de una poblacion es la capacidad para 
describir un conjunto de numeros. Las distribuciones de frecuencia dan un metodo grafico y 
util para caracterizar poblaciones conceptuales o reales de numeros. Las medidas descriptivas 
numericas son a veces mas utiles cuando deseamos hacer una inferencia y medir la bondad 
de esa inferencia. 

El mecanismo para hacer inferencias es proporcionado por la teorfa de probabilidad. El 
probabilista razona desde una poblacion conocida hasta el resultado de un experimento indi¬ 
vidual, la muestra. En contraste, el experto en estadfstica utiliza la teorfa de probabilidad para 
calcular la probabilidad de una muestra observada y para inferir a partir de esta las caracterfs- 
ticas de una poblacion desconocida. Asf, la probabilidad es la base de la teorfa de estadfstica. 

Por ultimo, hemos observado la diferencia entre teorfa y realidad. En este texto estudiare- 
mos la teorfa matematica de la estadfstica, que es una idealization de la naturaleza. Es riguro- 
sa, matematica y sujeta a estudio en un vacfo aislado por completo del mundo real. O puede 
estar ligada estrechamente a la realidad y puede ser util para hacer inferencias a partir de datos 
en todos los campos de la ciencia. En este texto seremos utilitarios. No veremos la estadfsti¬ 
ca como una rama de las matematicas sino como un campo de las ciencias que se ocupa en 
desarrollar una teorfa practica de informacion. Consideraremos la estadfstica como un campo 
separado, analogo a la ffsica, no como rama de las matematicas sino como una teorfa de la 
informacion que utiliza gran cantidad de matematicas. 

Los capftulos siguientes profundizaran en los temas que hemos encontrado en esta intro¬ 
duction. Empezaremos con un estudio del mecanismo empleado para hacer inferencias, la 
teorfa de probabilidad. Esta teorfa proporciona modelos teoricos para generar datos experi- 
mentales y, por tanto, da la base para nuestro estudio de inferencia estadfstica. 
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Ejercicios complementarios 

1.22 Demuestre que la suma de las desviaciones de un conjunto de mediciones alrededor de su media es igual 
a cero; es decir. 


-y) =0. 

i—i 

1.23 La duracion media de anuncios comerciales por television es de 75 segundos con desviacion estandar de 
20 segundos. Para contestar lo siguiente, suponga que las duraciones estan distribuidas normalmente en 
forma aproximada. 

a ^Que porcentaje de anuncios dura mas de 95 segundos? 

b iQue porcentaje de anuncios dura entre 35 y 115 segundos? 

c ^Esperaria que los anuncios duren mas de 2 minutos? ^,Por que si o por que no? 

1.24 Los deportes acuaticos se han sugerido como metodo de ejercicio cardiovascular para atletas lesionados 
y otros que deseen un programa de entrenamiento aerobico de bajo impacto. En un estudio para inves- 
tigar la relacion entre cadencia de ejercicios y ritmo cardiaco, 1 se midieron los ritmos cardiacos de 20 
voluntaries en buenas condiciones a una cadencia de 48 ciclos por minuto (un ciclo formado por dos 
pasos). Los datos son como sigue: 

87 109 79 80 96 95 90 92 96 98 

101 91 78 112 94 98 94 107 81 96 

a Use la amplitud de las mediciones para obtener una estimation de la desviacion estandar. 
b Construya un histograma de frecuencia para los datos. Use el histograma para obtener una aproxima- 
cion visual a y y 5. 

c Calcule y y s. Compare estos resultados con las verificaciones de calculo proporcionadas por los 
incisos a y b. 

d Construya los intervalos y ± ks, k = 1, 2 y 3, y cuente el numero de mediciones que caen en cada 
intervalo. Compare las fracciones que caen en los intervalos con las fracciones que esperaria de 
acuerdo con la regia empfrica. 


1. R. P. Wilder. D. Breenan y D. E. Schotte, “A Standard Measure for Exercise Prescription for Aqua Running”, 
en American Journal of Sports Medicine 21(1) (1993): 45. 
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1.25 Los datos siguientes dan los tiempos de falla para n = 88 radiotransmisores-receptores: 


16 

224 

16 

80 

96 

536 

400 

80 

392 

576 

128 

56 

656 

224 

40 

32 

358 

384 

256 

246 

328 

464 

448 

716 

304 

16 

72 

8 

80 

72 

56 

608 

108 

194 

136 

224 

80 

16 

424 

264 

156 

216 

168 

184 

552 

72 

184 

240 

438 

120 

308 

32 

272 

152 

328 

480 

60 

208 

340 

104 

72 

168 

40 

152 

360 

232 

40 

112 

112 

288 

168 

352 

56 

72 

64 

40 

184 

264 

96 

224 

168 

168 

114 

280 

152 

208 

160 

176 


a Utilice el rango para calcular a para los n = 88 tiempos para falla. 

b Construya un histograma de frecuencia para los datos. [Observe la tendencia de la distribution a 
extenderse hacia fuera (sesgo) a la derecha.] 

c Use una calculadora (o computadora) para calcular yys. (Hacer manualmente el calculo es demasia- 
do tedioso para este ejercicio.) 

d Calcule los intervalos y ± ks, k = 1, 2 y 3, y cuente el numero de mediciones que caen en cada 
intervalo. Compare sus resultados con los resultados de la regia empfrica. Observe que la regia ernpl- 
rica proporciona una description mas o rnenos buena de estos datos, aun cuando la distribution esta 
altamente sesgada. 

1.26 Compare la razon entre la amplitud y s para los tres tamanos muestrales ( n = 6, 20 y 88) para los 
Ejercicios 1.12, 1.24 y 1.25. Observe que la razon tiende a aumentar a medida que aumenta la cantidad 
de datos. Cuanto mayor es la cantidad de datos, mayor sera su tendencia a contener algunos valores 
extremos que inflaran el rango y tendran relativamente poco efecto en a. Pasamos por alto este fenome- 
no y sugerimos que el lector use 4 como la razon para hallar un valor estimado de a- al comprobar sus 
calculos. 

1.27 Un conjunto de 340 calificaciones de examen, que muestran una distribution de frecuencia relativa en 
forma de campana, tiene una media de y — 72 y una desviacion estandar de a = 8. ^Aproximadamente 
cuantas de las calificaciones se esperaria que cayeran en el intervalo de 64 a 80? lY en el intervalo de 
56 a 88? 

1.28 La descarga de solidos suspendidos de una mina de fosfato esta normalmente distribuida con una des- 
carga media diaria de 27 miligramos por litro (mg/L) y desviacion estandar de 14 mg/L. ^En que pro¬ 
portion de los dfas sera la descarga diaria menor que 13 mg/L? 

1.29 Una maquina produce cojinetes con diametro medio de 3.00 pulgadas y desviacion estandar de 0.01 pul- 
gada. Los cojinetes con diametros de mas de 3.02 o de menos de 2.98 no satisfacen las especificaciones 
de calidad. 

a i Aproximadamente que fraction de la production de esta maquina no cumplira con las especificacio¬ 
nes? 

b iQue suposiciones hizo usted con respecto a la distribution de diametros de cojinetes para contestar 
esta pregunta? 

1.30 En comparacion con sus companeras que se quedan en casa, las mujeres empleadas fuera de casa tienen 
niveles mas altos de lipoprotefnas de alta densidad (HDL, por sus siglas en ingles), el colesterol “bueno” 
asociado con menor riesgo de ataques al corazon. Un estudio de niveles de colesterol en 2000 mujeres, 
en edades de 25 a 64 y que viven en Augsburg. Alemania, fue realizado por Ursula Haertel, Ulrigh Keil 


2. Science News 135 (junio de 1989): 389. 
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y colegas 2 en el GSF-Medis Institut en Munich. De estas 2000 mujeres, el 48% que trabajaban fuera 
de casa tuvieron niveles de HDL que estaban entre 2.5 y 3.6 miligramos por decilitro (mg/dL) mas altos 
que los niveles de HDL de sus similares que se quedaban en casa. Suponga que la diferencia en niveles 
de HDL esta normalmente distribuida, con media 0 (lo que indica que no hay diferencia entre los dos 
grupos de mujeres) y desviacion estandar de 1.2 mg/dL. Si usted fuera a seleccionar al azar una mujer 
empleada y una que se queda en casa, ),cual es la probabilidad de que la diferencia en sus niveles de 
HDL este entre 1.2 y 2.4? 

El ano pasado un proceso de produccion de fertilizantes ha mostrado un promedio de production diaria 
de 60 toneladas con una varianza en la produccion diaria de 100. Si la produccion bajara a menos de 40 
toneladas manana, ),este resultado le harfa sospechar una anomalfa en el proceso? (Calcule la probabili¬ 
dad de obtener menos de 40 toneladas.) ^Que suposiciones hizo usted con respecto a la distribution de 
producciones? 

Sea Lai. Demuestre que, para cualquier conjunto de n mediciones, la fraction incluida en el intervalo 
y — ks a y + ks es al menos (1 - 1 lie). [Sugerencia: 



En esta expresion, sustituya con ks todas las desviaciones para las cuales \y i — y|> ks. Simplifique.] 
Este resultado se conoce como teorema de Tchebysheff? 

El gerente de personal de cierta empresa tiene registros del numero de empleados ausentes por dfa. El 
numero promedio de ausentes es 5.5 y la desviacion estandar es 2.5. Debido a que hay muchos dfas 
con cero, uno o dos ausentes y solo unos pocos con mas de diez ausentes, la distribution de frecuencia 
esta altamente sesgada. El gerente desea publicar un intervalo en el que al menos 75% de estos valores 
mienta. Use el resultado del Ejercicio 1.32 para hallar ese intervalo. 

Para los datos estudiados en el Ejercicio 1.33, de un lfmite superior a la fraction de dfas cuando haya 
mas de 13 ausentes. 

Una companfa farmaceutica desea saber si un medicamento experimental tiene efecto sobre la presion 
sistolica de la sangre. A 15 pacientes seleccionados al azar se les aplico el medicamento y, despues de 
un tiempo suficiente para que el medicamento tuviera efecto, se registraron sus presiones sistolicas. Los 
datos aparecen a continuation: 

172 140 123 130 115 

148 108 129 137 161 

123 152 133 128 142 

a Calcule el valor de s usando la aproximacion del tango, 
b Calcule los valores de y y i para las 15 lecturas de presion sangufnea. 

c Use el teorema de Tchebysheff (Ejercicio 1.32) para hallar valores de a y b tales que al menos 75% 
de las mediciones de presion sangufnea se encuentren entre ay b. 
d ),Funciono el teorema de Tchebysheff? Es decir, use la information para hallar el porcentaje real de 
lecturas de presion sangufnea que estan entre los valores de ay b hallados en el inciso c. ),Este por¬ 
centaje real es mayor que 75%? 

Una muestra aleatoria de 100 zorros fue examinada por un equipo de veterinarios para determinar el 
predominio de un parasito especffico. Al contar el numero de parasitos de este tipo especffico, los veteri- 
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3. Los ejercicios precedidos de un asterisco son opcionales. 
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narios hallaron que 69 zorros no tenfan los parasitos del tipo de interes, 17 no tenfan un parasito del tipo 
en estudio y asf sucesivamente. En la tabla siguiente se da un resumen de sus resultados. 


Numero de parasitos 

0 1 2345678 

Numero de zorros 

69 17 6 3 1 2 1 0 1 


a Construya el histograma de frecuencia relativa para el numero de parasitos por zorro. 
b Calcule y y s para la information dada. 

c iQue fraction del conteo de parasitos cae dentro de 2 desviaciones estandar de la media? ^Dentro de 
3 desviaciones estandar? ^Sus resultados concuerdan con el teorema de Tchebysheff (Ejercicio 1.32) 
y/o la regia empfrica? 

1.37 Estudios realizados indican que el agua potable suministrada por algunos viejos sistemas municipales 
de tuberfa con recubrimiento de plomo pueden contener niveles peligrosos de este. Con base en datos 
presentados por Karalekas y colegas, 4 parece que la distribution de lecturas de contenido de plomo para 
esperimenes individuales de agua tiene una media de .033 mg/L y desviacion estandar de .10 mg/L. 
Explique por que es obvio que las lecturas de contenido de plomo no estan normalmente distribuidas. 

1.38 En el Ejercicio 1.19 la media y la desviacion estandar de la cantidad de cloroformo presente en fuentes 
de agua eran 34 y 53, respectivamente. Usted argumento que las cantidades de cloroformo podrian no 
estar normalmente distribuidas. Use el teorema de Tchebysheff (Ejercicio 1.32) para describir la dis¬ 
tribution de las cantidades de cloroformo en fuentes de agua. 


4. P. C. Karalekas. Jr., C. R. Ryan y F. B. Taylor, “Control of Lead, Copper and Iron Pipe Corrosion in Boston”, 
American Water Works Journal (febrero de 1983): 92. 
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2.1 Introduccion 

En nuestras conversaciones cotidianas, el termino probabilidad es una medida de la creencia 
de que un evento futuro pueda ocurrir. Aceptamos esto como una interpretacion significativa 
y practica de probabilidad pero buscamos un concepto mas claro de su contexto, de como se 
mide y como ayuda a hacer inferencias. 

El concepto de probabilidad es necesario para trabajar con mecanismos ffsicos, biologicos 
o sociales que generan observaciones que no se pueden predecir con certeza. Por ejemplo, la 
presion sangumea de una persona en un punto dado en el tiempo no se puede predecir con 
certeza y nunca sabemos la carga exacta que un puente resistira antes de desplomarse en un 
no. Eventos de esa naturaleza no se pueden predecir con certeza, pero la frecuencia relativa 
con la que ocurren en una larga serie de intentos es a veces sorprendentemente estable. Los 
eventos que poseen esta propiedad reciben el nombre de eventos aleatorios o estocdsticos. 
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Esta frecuencia relativa a largo plazo proporciona una medida intuitivamente significativa 
de nuestra creencia de que ocurrira un evento aleatorio si se hace una observation futura. Es 
imposible, por ejemplo, predecir con certeza que una moneda normal caiga de cara en un solo 
tiro, pero estarfamos dispuestos a decir con un grado razonable de confianza que la fraction 
de caras en una larga serie de intentos serfa muy cercana a .5. Que esta frecuencia relativa 
se use comunmente como medida de la creencia en el resultado de un solo tiro es evidente 
cuando consideramos la probabilidad desde el punto de vista de un jugador. Este arriesga 
dinero en un solo tiro de una moneda, no en una larga serie de tiros. La frecuencia relativa de 
que aparezca una cara en una larga serie de tiros, que un jugador llama probabilidad de una 
cara, le da una medida de la probabilidad de ganar en un solo tiro. Si la moneda no estuviera 
balanceada y diera 90% de caras en una larga serie de tiros, el jugador diria que la proba¬ 
bilidad de que saiga una cara es .9 y tendrfa confianza en que saliera una cara en un solo tiro 
de la moneda. 

El ejemplo anterior posee algunas analogfas realistas y practicas. En muchos aspectos to- 
dos somos jugadores. Una ffsica investigadora apuesta tiempo y dinero en un proyecto de 
investigation y se interesa por su exito en un solo tiro de su moneda simbolica. Del mismo 
modo, la inversion de capital en una nueva planta de manufacturas es un juego que representa 
un solo tiro de una moneda en el que el empresario tiene grandes esperanzas de exito. La frac¬ 
cion de inversiones similares que sean exitosas, en una larga serie de intentos, es de interes 
para el empresario solo hasta donde de una medida de la creencia en el resultado exitoso de 
una sola inversion individual. 

El concepto de frecuencia relativa de probabilidad, aunque intuitivamente significativo, 
no da una definition rigurosa de probabilidad. Se han propuesto muchos otros conceptos de 
probabilidad, incluyendo el de probabilidad subjetiva que permite que la probabilidad de un 
evento varfe dependiendo de la persona que efectue la evaluation. No obstante, para nuestros 
fines, aceptamos una interpretation basada en la frecuencia relativa como medida significativa 
de nuestra idea de que ocurrira un evento. Examinemos a continuation el enlace que la proba¬ 
bilidad hace entre observacion e inferencia. 


2.2 Probabilidad e inferencia 

El papel que la probabilidad desempena para hacer inferencias se estudiara con detalle despues 
de sentar una base adecuada para la teorfa de probabilidad. En este punto presentaremos un 
tratamiento elemental de esta teorfa por medio de un ejemplo y una petition a su intuition. 

El ejemplo seleccionado es similar al presentado en la Seccion 1.4 pero mas sencillo y me- 
nos practico. Se escogio por la facilidad con la que podemos visualizar la poblacion y muestra 
y porque da un mecanismo que produce observacion, para el cual se constraint un modelo 
probabilfstico en la Seccion 2.3. 

Considere a un jugador que desea hacer una inferencia respecto al balance de un dado. 
La poblacion conceptual de interes es el conjunto de numeros que se generarian si el dado se 
tirara un numero infinito de veces. Si el dado estuviera perfectamente balanceado, un sexto 
de las mediciones de esta poblacion serfan los numeros 1, un sexto de numeros 2, un sexto de 
numeros 3 y asf sucesivamente. La correspondiente distribucion de frecuencia se muestra en 
la Figura 2.1. 

Si se usa el metodo cientffico, un jugador propone la hipotesis de que el dado esta ba¬ 
lanceado y busca observaciones de la naturaleza para contradecir la teorfa, si es falsa. Se 
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F I G U R A 2.1 
Distribucion de 
frecuencia para la 
poblacion generada 
por un dado 
balanceado 



Numero de 
la cara superior 
del dado 


selecciona una muestra de diez tiros de la poblacion al tirar el dado diez veces; los diez tiros 
resultan en numeros 1. El jugador estima este resultado de la naturaleza con un ojo envidioso 
y concluye que su hipotesis no esta de acuerdo con la naturaleza y por tanto que el dado no 
esta balanceado. 

El razonamiento empleado por el jugador identifica el papel que desempena la probabili¬ 
dad para hacer inferencias. El jugador rechazo su hipotesis (y concluyo que el dado no esta 
balanceado) no porque sea imposible tirar diez numeros 1 en diez tiros de un dado balanceado 
sino porque esto es altamente improbable. Su evaluacion de la probabilidad fue principalmen- 
te subjetiva. Esto es, el jugador puede no haber sabido como calcular la probabilidad de diez 
numeros 1 en diez tiros, pero tenia una impresion intuitiva de que este evento era muy poco 
probable si el dado estuviera balanceado. El punto a observar es que su decision estuvo basada 
en la probabilidad de la muestra observada. 

La necesidad de una teorfa de probabilidad, que dara un metodo riguroso para hallar un nu¬ 
mero (o probabilidad) que estara de acuerdo con la frecuencia relativa real de que ocurra un 
evento en una larga serie de intentos, es evidente si imaginamos un resultado diferente para la 
muestra del jugador. Suponga, por ejemplo, que en lugar de diez numeros 1 el observo cinco 
numeros 1 junto con dos numeros 2, un 3, un 4 y un 6. ^Este resultado es tan improbable que 
deberfamos rechazar nuestra hipotesis de que el dado esta balanceado y concluir que el dado 
esta cargado a favor de los numeros 1 ? Si debemos apoyarnos solo en la experiencia e intui¬ 
tion para hacer nuestra evaluacion, no es tan facil decidir si la probabilidad de cinco numeros 
1 en diez tiros es grande o pequena. La probabilidad de tirar cuatro numeros 1 en diez tiros 
serfa incluso mas diffcil de adivinar. No negaremos que resultados experimentales son en oca- 
siones obviamente inconsistentes con una hipotesis dada y llevan a su rechazo, pero muchos 
resultados experimentales caen en un area gris donde requerimos una evaluacion rigurosa de 
la probabilidad de que ocurran. De hecho, no es diffcil demostrar que evaluaciones intuitivas 
de probabilidades en ocasiones llevan a respuestas que estan erroneas y resultan en inferencias 
incorrectas acerca de la poblacion objetivo. Por ejemplo, si hay 20 personas en un cuarto, casi 
todos calcularfan que es muy poco probable que hubiera dos o mas personas con el mismo 
cumpleanos, pero, en ciertas suposiciones razonables, en el Ejemplo 2.18 demostraremos que 
la probabilidad de que eso ocurra es mayor que .4, numero que es sorprendentemente grande 
para muchos. 

Necesitamos una teorfa de probabilidad que nos permita calcular la probabilidad (o una 
cantidad proporcional a la probabilidad) de observar resultados especihcados, suponiendo que 
nuestro modelo hipotetico sea correcto; este tema se desarrollara con detalle en los capftulos 
siguientes. Nuestra meta inmediata es presentar una introduction a la teorfa de la probabili¬ 
dad, que proporciona la base para la inferencia estadfstica moderna. Empezaremos por repa- 
sar alguna notation de conjuntos que usaremos para construir modelos probabilfsticos para 
experimentos. 
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2.3 Un repaso de notacion de conjuntos 

Para continuar con un desarrollo ordenado de la teoria de probabilidad, necesitamos algunos 
conceptos basicos de teoria de conjuntos. Usaremos letras mayusculas A, B, C ,..., para deno¬ 
tar conjuntos de puntos. Si los elementos del conjunto A son a v a 2 y a 3 , escribiremos 

A = {flj, a 2 , a 3 }. 

Denotemos con S el conjunto de todos los elementos en consideracion; esto es, S es el 
conjunto universal. Para dos conjuntos cualesquiera A y B. diremos que A es un subconjunto 
de B, o A esta contenido en B (denotado A C B), si todo punto en A tambien esta en B. El 
conjunto nulo, o vacio, denotado por 0, es el conjunto que no contiene puntos. Entonces, 0 
es un subconjunto de todo conjunto. 

Los conjuntos y las relaciones entre conjuntos se pueden representar en forma conveniente 
con el uso de diagramas de Venn. El diagrama de Venn de la Figura 2.2 muestra dos conjuntos, 
Ay B. del conjunto universal S. El conjunto A es el conjunto de todos los puntos dentro del 
triangulo; el conjunto B es el conjunto de todos los puntos dentro del cfrculo. Observe que en 
la Figura 2.2, AC B. 

Considere ahora dos conjuntos arbitrarios de puntos. La union de A y B, denotada por 
A U B, es el conjunto de todos los puntos en A o B o en ambos. Esto es, la union de A y B 
contiene todos los puntos que estan en al menos uno de los conjuntos. El diagrama de Venn 
de la Figura 2.3 muestra dos conjuntos Ay B, donde A es el conjunto de puntos en el cfrculo 


FIGURA 2.2 
Diagrama de Venn 
para A C B 


S 



S 



FIGURA 2.3 
Diagrama de Venn 
para A U B 
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F I G U R A 2.4 
Diagrama de Venn 
para AB 


FIGURA 2.5 
Diagrama de Venn 
para A 


S 



izquierdo y B es el conjunto de puntos en el cfrculo derecho. El conjunto A U B es la region 
sombreada formada por todos los puntos dentro de cualquiera de los cfrculos (o de ambos). La 
palabra clave para expresar la union de dos conjuntos es o (que significa A o B o ambos). 

La intersection de A y B, denotada por A n B o por AB, es el conjunto de todos los puntos 
en A y B. El diagrama de Venn de la Figura 2.4 muestra dos conjuntos Ay B, con A n B for- 
mado por los puntos en la region sombreada donde los dos conjuntos se traslapan. La palabra 
clave para expresar intersecciones es y (que significa Ay B simultdneamente jK 

Si A es un subconjunto de S, entonces el complemento de A, denotado por A. es el conjunto 
de puntos que estan en S pero no en A. La Figura 2.5 es un diagrama de Venn que ilustra que 
el area sombreada en S pero no en A es A. Observe que A U A = S. 

Se dice que dos conjuntos, Ay B, son disjuntos o mutuamente excluyentes, si A fl B = 0. 
Esto es, los conjuntos mutuamente excluyentes no tienen puntos en comun. El diagrama de 
Venn de la Figura 2.6 ilustra dos conjuntos A y B que son mutuamente excluyentes. Examinando 
la Figura 2.5 es facil ver que, para cualquier conjunto A, A y A son mutuamente excluyentes. 

Considere el problema de la Seccion 2.2 de lanzar un dado y denote con S el conjunto de 
todas las posibles observaciones numericas para un solo tiro de un dado. Esto es , S = {1,2, 
3,4, 5, 6}. Sea A = {1, 2},B = {1, 3} y C= {2,4, 6}. Entonces A U B = {1, 2, 3}, A n B 
= {1} y A = {3, 4, 5, 6}. Del mismo modo, observe que By C son mutuamente excluyentes, 
mientras que A y C no lo son. 


s 
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FIGURA 2.6 s 



No trataremos de hacer aquf un repaso a fondo de algebra de conjuntos, pero mencionamos 
cuatro igualdades de considerable importancia. Estas son las leyes distributivas , dadas por 

A D(B UC) = (A n B) U(A flC), 

AU(BnC)=(AUB) n(AUC), 

y las leyes de DeMorgan: 

(A HB) =AUB y (A U B) = A DB. 

En la siguiente seccion continuaremos con una exposition elemental de la teoria de pro- 
babilidad. 


Ejercicios 

2.1 Suponga que una familia contiene dos hijos de edades diferentes y estamos interesados en el genero de 
estos ninos. Denotemos con F que una hija es mujer y M que el hijo es hombre y denote con un par, por 
ejemplo F M , que el hijo de mayor edad es la nina y el mas joven es el nino. Hay cuatro puntos en el 
conjunto S de posibles observaciones: 

5 = {FF, FM, MF, MM}. 

Denote con A el subconjunto de posibilidades que no contenga hombres; B, el subconjunto que con¬ 
tiene dos hombres; y C, el subconjunto que contenga al menos un hombre. Indique los elementos de 
A, B, C, A n B, A U B, A H C. A U C, B fl C, B U C y C n B. 

2.2 Suponga que Ay B son dos eventos. Escriba las expresiones que contengan uniones, intersecciones y 
complementos que describan lo siguiente: 

a Ocurren ambos eventos. 
b Al menos uno ocurre. 
c Ninguno ocurre. 
d Exactamente uno ocurre. 

2.3 Trace diagramas de Venn para verificar las leyes de DeMorgan. Esto es, para dos conjuntos cualesquiera 
A y B, (A U B) = A n ~B y (A (T B) = A U B. 







26 


Capftulo2 Probabilidad 


2.4 Si A y B son dos conjuntos, dibuje diagramas de Venn para verificar lo siguiente: 

a A = (A PIS) U(A OB), 
b Sifi C A entonces A — B U(A (IB). 

2.5 Consulte el Ejercicio 2.4. Use las identidades A = Ar\SyS = BUBy una ley distributiva para de- 
mostrar que 

a A = (A HB) U(A flfi). 
b Si B C A entonces A = B U (A (1 B). 

c Ademas, demuestre que (AflS)y (A OS) son mutuamente excluyentes y que, por tanto, A es la 
union de dos conjuntos mutuamente excluyentes, (A n B) y (A n B) 
d Tambien demuestre que By(AflB) son mutuamente excluyentes y, si B C A, A es la union de dos 
conjuntos mutuamente excluyentes, By (A HB). 

2.6 Suponga que se tiran dos dados y que se observan los numeros de las caras superiores. Denotemos con 
S el conjunto de todos los pares posibles que se pueden observar. [Estos pares se pueden indicar, por 
ejemplo, si con (2, 3) se denota que un 2 se ha observado en el primer dado y un 3 en el segundo.] 

a Defina los siguientes subconjuntos de S'. 

A: el numero en el segundo dado es par. 

B: la suma de los dos numeros es par. 

C: al menos un numero del par es impar. 

b Indique los puntos enA,C,AflB,An6,AUSyAnC. 

2.7 Un grupo de cinco solicitantes para un par de trabajos identicos esta formado por tres hombres y dos 
mujeres. El empleador ha de seleccionar dos de los cinco solicitantes para los trabajos. Denote con S el 
conjunto de todos los resultados posibles para la seleccion del empleador. Denote con A al subconjunto 
de resultados correspondientes a la seleccion de dos hombres y con B al subconjunto correspondiente a 
la seleccion de al menos una mujer. Indique los resultados en A, B, A U B, A fl B y A n B. Denote los 
hombres y mujeres diferentes con M v M 3 y W v W 2 . respectivamente.) 

2.8 De una encuesta de 60 estudiantes que asisten a clase en una universidad, se encontro que 9 vivlan fuera 
del campus, 36 eran pasantes y 3 eran pasantes que vivian fuera del campus. Encuentre el numero de 
estos estudiantes que 

a eran pasantes, vivian fuera del campus o ambos. 
b eran pasantes que vivian en el campus, 
c eran graduados que vivian en el campus. 


2.4 Un modelo probabilfstico para un experimento: 
el caso discreto 

En la Seccion 2.2 nos referimos al experimento de lanzar un dado cuando observamos el 
numero que aparecfa en la cara superior. Usaremos el termino experimento para incluir obser- 
vaciones obtenidas de situaciones incontrolables por completo (por ejemplo observaciones en 
el precio diario de una accion en particular) asf como aquellas hechas en condiciones contro- 
ladas de laboratorio. Tenemos la siguiente definicion: 
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DEFINICION 2.1 


Un experimento es el proceso por medio del cual se hace una observation. 


Ejemplos de experimentos incluyen el tiro de monedas y dados, medir el cociente de inteli- 
gencia (IQ) de una persona o determinar el numero de bacterias por centimetre cubico en una 
porcion de alimento procesado. 

Cuando se realiza un experimento, puede terminar en uno o mas resultados que se llaman 
eventos. En nuestras exposiciones, los eventos se denotaran con letras mayusculas. Si el expe¬ 
rimento consiste en contar el numero de bacterias en una porcion de alimento, algunos eventos 
de interes podrian ser 

A: Exactamente 110 bacterias estan presentes. 

B: Mas de 200 bacterias estan presentes. 

C: El numero de bacterias presentes esta entre 100 y 300. 

Algunos eventos asociados con un solo tiro de un dado balanceado son los siguientes: 

A: Observar un numero impar. 

B: Observar un numero menor que 5. 

C: Observar un 2 o un 3. 

£j: Observar uni. 

E 2 : Observar un 2. 

E : (. Observar un 3. 

E 4 : Observar un 4. 

E 5 : Observar un 5. 

E 6 \ Observar un 6. 

Usted puede ver que hay una clara diferencia entre algunos de los eventos asociados con 
el experimento de tirar un dado. Por ejemplo, si observo el evento A (un numero impar), al 
mismo tiempo habra observado Ej, E 3 o E 5 . Asi, el evento A, que se puede descomponer en 
otros tres eventos, se denomina evento coinpuesto. En contraste, los eventos E u E 2 , E 2 , E 4 , E s 
y E 6 no se pueden descomponer y reciben el nombre de eventos simples. Un evento simple 
puede ocurrir solo en un modo, mientras que un evento compuesto puede ocurrir en mas de 
una forma distinta. 

Ciertos conceptos de teoria de conjuntos son utiles para expresar las relaciones entre diver- 
sos eventos asociados con un experimento. Debido a que los conjuntos son grupos de puntos, 
asociamos un punto distinto, llamado punto muestral, con todos y cada uno de los eventos 
simples asociados con un experimento. 


DEFINICION 2.2 Un evento simple no se puede descomponer. Cada evento simple corresponde a un y 
solo un punto muestral. La letra E con un subindice se empleara para denotar un evento 
simple o el correspondiente punto muestral. 


Asi, podemos considerar un evento simple como un conjunto formado por un solo punto, 
es decir, el solo punto muestral asociado con el evento. 





28 Capftulo2 Probabilidad 


FIGURA 2.7 
Diagrama de Venn 
para el espacio 
muestral asociado con 
el experimento de 
tirar un dado 


DEFINICION 2.3 


DEFINICION 2.4 


S 



El espacio muestral asociado con un experimento es el conjunto formado por todos los 
posibles puntos muestrales. Un espacio muestral estara denotado por S. 


Facilmente podemos ver que el espacio muestral S asociado con el experimento de lanzar 
un dado esta formado por seis puntos muestrales correspondientes a los seis eventos simples 
£j, E 2 , E 3 , E a , E s y E 6 . Esto es, S = [ E t , E 2 , E 3 , E 4 , E 5 , E b ). Un diagrama de Venn que exhibe 
el espacio muestral para el experimento de lanzar un dado se da en la Figura 2.7. 

Para el ejemplo de microbiologia de contar bacterias en un especimen de alimento, haga- 
mos que E 0 corresponda a observar 0 bacterias, E { a observar 1 bacteria y asi sucesivamente. 
Entonces el espacio muestral es 


S = {E 0 ,E h E 2 ,... j 

porque no se puede excluir ningun numero entero de bacterias como posible resultado. 

Ambos espacios muestrales que examinamos tienen la propiedad de que estan formados 
ya sea por un numero finito o uno contable de puntos muestrales. En el ejemplo de lanzar un 
dado hay seis (un numero finito) puntos muestrales. El numero de puntos muestrales asocia¬ 
do con el experimento de contar bacterias es infinito, pero el numero de puntos muestrales 
distintos se puede poner en correspondencia biunivoca con los enteros (es decir, el numero de 
puntos muestrales es contable). Se dice que estos espacios muestrales son discretos. 


Un espacio muestral discreto es aquel que esta formado ya sea por un numero finito o 
uno contable de puntos muestrales distintos. 


Cuando un experimento se realiza en una sola vez, se observara un y solo un evento simple. 
Por ejemplo, si se lanza un dado y se observa un 1, no se puede al mismo tiempo observar un 
2. Asi, el punto muestral simple £j asociado con observar un 1 y el punto muestral simple E 2 
asociado con observar un 2 son distintos, y los conjuntos {£j} y { E 2 ) son conjuntos mutua- 
mente excluyentes. Por tanto, los eventos £j y E 2 son mutuamente excluyentes. Del mismo 
modo, todos los eventos simples distintos corresponden a conjuntos mutuamente excluyentes 
de eventos simples y son por tanto eventos mutuamente excluyentes. 

Para experimentos con espacios muestrales discretos, los eventos compuestos se pueden 
ver como grupos (conjuntos) de puntos muestrales o bien, de manera equivalente, como unio- 
nes de los conjuntos de puntos muestrales simples correspondientes a los eventos simples 
apropiados. Por ejemplo, el evento A de lanzar un dado (observar un numero impar) ocurrira 
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FIGURA 2.8 
Diagrama de Venn 
para el experimento 
de lanzar un dado 


DEFINICION 2.5 


S 



si y solo si ocurre uno de los eventos simples E v £ 3 o £ 5 . Asi, 

A = {£i, E 3 , £ 5 } o A = Ei UE3 UE5. 

Del mismo modo, B (observar un numero menor que 5) se puede escribir como 

B — {£ 1 , £ 2 , £ 3 , £ 4 } o B = E\ U £2 U £3 U £ 4 . 

La regia para determinar cuales eventos simples incluir en un evento compuesto es muy preci- 
sa. Un evento simple £ ; se incluye en el evento A si y solo si A ocurre siempre que ocurra £ ; . 


Un evento en un espacio muestral discreto S es un conjunto de puntos muestrales, es 
decir, cualquier subconjunto de S. 


La Figura 2.8 da un diagrama de Venn que representa el espacio muestral y los eventos A 
(observar un numero impar) y B (observar un numero menor que 5) para el experimento de 
lanzar un dado. Observe que es facil visualizar la relacion entre eventos si se usa un diagrama 
de Venn. 

Por la Defmicion 2.5, cualquier evento en un espacio muestral S es un subconjunto de S. En 
el ejemplo relacionado con determinar el numero de bacterias en una porcion de alimento, el 
evento B (el numero de bacterias es mayor que 200) se puede expresar como 


B —{£ 201 , E 202 , Ezm,...}, 


donde E i denota el evento simple de que hay i bacterias presentes en la muestra de alimento 
e i = 0 , 1 , 2 ,... 

Un modelo probabilfstico para un experimento con un espacio muestral discreto se puede 
construir al asignar una probabilidad numerica a cada evento simple del espacio muestral S. 
Seleccionaremos este numero, una medida de nuestra creencia en que ocurrira el evento en 
una sola repetition del experimento, de forma tal que sera consistente con el concepto de 
frecuencia relativa de probabilidad. Aun cuando la frecuencia relativa no da una defmicion 
rigurosa de probabilidad, cualquier defmicion aplicable al mundo real debe concordat' con 
nuestra notion intuitiva de las frecuencias relativas de eventos. 

Al analizar el concepto de frecuencia relativa de probabilidad, vemos que deben cumplirse 
tres condiciones. 

1. La frecuencia relativa de que ocurra cualquier evento debe ser mayor o igual a cero. 

Una frecuencia relativa negativa no tiene sentido. 
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2. La frecuencia relativa de todo el espacio muestral S debe ser la unidad. Debido a que 
todo posible resultado del experimento es un punto en S, se deduce que S debe ocurrir 
cada vez que se realice el experimento. 

3. Si dos eventos son mutuamente excluyentes, la frecuencia relativa de la union de 
ambos es la suma de sus respectivas frecuencias relativas. (Por ejemplo, si el experi¬ 
mento de lanzar un dado balanceado da un 1 en 1/6 de los tiros, debe dar un 1 o un 2 
con 1/6 + 1/6 = 1/3 de tiros.) 

Estas tres condiciones forman la base de la siguiente definicion de probabilidad. 


DEFINICION 2.6 Suponga que S es un espacio muestral asociado con un experimento. A todo evento A en 
S (A es el subconjunto de S ) le asignamos un numero, P(A), llamado probabilidad de A, 
de modo que se cumplen los siguientes axiomas: 

Axioma 1: P(A) > 0. 

Axioma 2: P(S) = 1. 

Axioma 3: Si A v A 2 , A 3 ,... forman una secuencia de eventos por pares mutuamente 
excluyentes en S (es decir, A ; n A. = 0 si i A j), entonces 

OO 

P(Ai UA 2 UA 3 U...,) = 

i=i 

Podemos facilmente demostrar que el Axioma 3, que esta expresado en terminos de 
una sucesion infinita de eventos, implica una propiedad similar para una sucesion finita. 
Especfficamente, si A u A 2 ,A n son eventos mutuamente excluyentes por pares, entonces 

n 

P{A\ U A 2 U A 3 U . . . UAn) = P ( A ‘^ 

i=i 

Observe que la definicion expresa solo las condiciones que una asignacion de probabili- 
dades debe satisfacer: no nos dice como asignarprobabilidades especfficas a los eventos. Por 
ejemplo, suponga que una moneda ha dado 800 “caras” en 1000 tiros previos. Considere el ex¬ 
perimento de un tiro mas de la misma moneda. Hay dos posibles resultados, cara o cruz, y por 
tanto dos eventos simples. La definicion de probabilidad nos permite asignar a estos eventos 
simples dos numeros no negativos cualesquiera que sumen 1. Por ejemplo, cada evento simple 
podrfa tener la probabilidad 1/2. En vista de la historia de esta moneda, no obstante, podrfa 
ser mas razonable asignar una probabilidad mas cercana a .8 al resultado donde aparece una 
cara. Las asignaciones especfficas de probabilidades deben ser consistentes con la realidad si 
el modelo probabillstico ha de servir a un proposito util. 

Para espacios muestrales discretos, es suficiente asignar probabilidades a cada evento sim¬ 
ple. Si se usa un dado balanceado para el ejemplo de lanzar un dado, parece razonable suponer 
que todos los eventos simples tendrfan la misma frecuencia relativa a la larga. Asignaremos 
una probabilidad de 1/6 a cada evento simple: P(E t ) = 1/6, para i = 1,2,..., 6 . Esta asignacion 
de probabilidades esta de acuerdo con el Axioma 1. Para ver que el Axioma 2 se satisfaga, 
escribamos 

P(S) = P{E\ U £ 2 U ...U E 6 ) = P(Ei) + P(E 2 )+ ■•• + P(E 6 ) = 1. 

La segunda igualdad es consecuencia de que el Axioma 3 debe cumplirse. El Axioma 3 nos 
dice que podemos calcular la probabilidad de cualquier evento al sumar las probabilidades de 
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EJEMPLO 2.1 


Solucion 


los eventos simples que contiene (recuerde que los eventos simples distintos son mutuamente 
excluyentes). El evento A se definio como “observar un numero impar”. Por tanto, 

P(A) = P(E\ U E 3 U E 5 ) = P(Ei) + P(E 3 ) + P(E 5 ) = 1/2. 


Un fabricante tiene cinco terminales de computadora aparentemente identicas listas para ser 
enviadas. Sin que el lo sepa, dos de las cinco estan defectuosas. Un pedido en particular soli- 
cita dos de las terminales y el pedido se surte seleccionando al azar dos de las cinco de que se 
dispone. 

a Indique el espacio muestral para el experimento. 

b Denote con A el evento de que el pedido se surta con dos terminales no defectuosas. 
Indique los puntos muestrales en A. 

c Construya un diagrama de Venn para el experimento que ilustre el evento A. 
d Asigne probabilidades a los eventos simples en tal forma que se use la information 
acerca del experimento y se satisfagan los axiomas de la Definition 2.6. 
e Encuentre la probabilidad del evento A. 

a Marque con D x y D 2 las dos terminales defectuosas y con G v G 2 y G 3 las tres termina¬ 
les buenas. Cualquier punto muestral estara formado por una lista de las dos terminales 
seleccionadas para envfo. Los eventos simples pueden denotarse con 

£| = {£>i, D 2 }, £ 5 = {D 2 , GJ, £ 8 = {Gl G 2 }, £,o = {G 2 , G 3 }. 

E 2 = {D u Gi}, E 6 = {ZU, G 2 }, E 9 = {G u G 3 }, 

E 3 = {Du G 2 }, £7 = {£>2, G 3 }, 

£4 = {£>i. G 3 |, 

Asf, hay diez puntos muestrales en S, y S = {E\,E 2 ,. ■., £10}■ 
b Evento A = {£g, Eg, Eio}- 

c 


s 



d Debido a que las terminales se seleccionan al azar, cualquier par de terminales es 
tan probable de ser seleccionado como cualquier otro. Entonces, £(£,) = 1/10, para 
i = 1,2, ..., 10, es una asignacion razonable de probabilidades. 
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e Como A = E s U Eg U £ 10 , el Axioma 3 implica que 

P(A) = P(E a ) + P(E g ) + P(E! 0 )=3/10. ■ 


La siguiente section contiene una description axiomatica del metodo para calcular P(A) 
que acabamos de usar. 

Antes de continuar, tomemos nota de que hay experimentos para los cuales el espacio mues- 
tral no es contable y por lo tanto no es discreto. Suponga, por ejemplo, que el experimento 
consiste en medir el nivel de glucosa en sangre de un paciente diabetico. El espacio muestral 
para este experimento contendrfa un intervalo de numeros reales y cualquiera de estos inter¬ 
vals contiene un numero incontable de valores. Por tanto, el espacio muestral no es discreto. 
En el Capftulo 4 examinaremos situaciones como esta; el resto de este capftulo esta dedicado 
a desarrollar metodos para calcular las probabilidades de eventos definidos en espacios mues- 
trales discretos. 

Ejercicios 

2.9 El tipo de sangre de todas las personas es A, B, AB u O. Ademas, cada persona tiene tambien el factor 
Rhesus (Rh) ( + ) o (-). Un tecnico medico registra el tipo de sangre de una persona y el factor Rh. 
Indique el espacio muestral para este experimento. 

2.10 Las proporciones de fenotipos sangumeos A, B, AB y O, en la poblacion de todos los caucasicos en 
Estados Unidos son aproximadamente .41, .10, .04 y .45, respectivamente. Un solo caucasico se selec- 
ciona al azar de la poblacion. 

a Indique el espacio muestral para este experimento. 

b Haga uso de la information dada antes para asignar probabilidades a cada uno de los eventos sim¬ 
ples. 

c ^Cual es la probabilidad de que la persona seleccionada al azar tenga tipo de sangre A o tipo AB? 

2.11 Un espacio muestral esta formado por cinco eventos simples, E { , £,, E 3 , E 4 y E s . 

a Si P{E\) = P{E 2 ) = 0.15, P(E 3 ) = 0.4y P{E A ) = 2 P(E 5 ), halle las probabilidades de£ 4 y E s . 

b Si P(E{) = 3P(E 2 ) = 0.3, encuentre las probabilidades de los eventos simples restantes si se sabe que 
son igualmente probables. 

2.12 Un vehlculo que llega a un crucero puede dar vuelta a la derecha, a la izquierda o continuar de frente. El 
experimento consiste en observar el movimiento de un solo vehiculo por el crucero. 

a Indique el espacio muestral para este experimento. 

b Suponiendo que todos los puntos muestrales son igualmente probables, encuentre la probabilidad de 
que el vehlculo de vuelta. 

2.13 Los estadounidenses pueden ser bastante suspicaces, en especial cuando se trata de conspiraciones del 
gobierno. Sobre la pregunta de si la Fuerza Aerea de Estados Unidos tiene oculta la prueba de la existen- 
cia de vida inteligente en otros planetas, las proporciones de estadounidenses con opiniones que varlan 
se dan en la tabla. 
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Opinion 

Proportion 

Muy probable 

.24 

Poco probable 

.24 

Improbable 

.40 

Otra 

.12 


Suponga que se selecciona un estadounidense y que se registra su opinion, 
a ^Cuales son los eventos simples para este experimento? 

b Todos los eventos simples que usted dio en el inciso a, ^,son igualmente probables? Si no es ast, ^,cua- 
les son las probabilidades que deben asignarse a cada uno? 
c ^Cual es la probabilidad de que la persona seleccionada encuentre al menos un poco probable que la 
Fuerza Aerea este ocultando information acerca de vida inteligente en otros planetas? 

2.14 Una encuesta clasifico a gran numero de adultos de acuerdo con si se les diagnostico la necesidad de 
usar lentes para corregir su vision de lectura o si ya usan lentes cuando leen. Las proporciones que caen 
en las cuatro categories resultantes se dan en la tabla siguiente: 



Usa lentes 


para leer 

Necesita lentes 

Si 

No 

SI 

.44 

.14 

No 

.02 

.40 


Si se selecciona un solo adulto del grupo grande, encuentre las probabilidades de los eventos definidas 
a continuation. El adulto 
a necesita lentes, 

b necesita lentes pero no los usa, 

c usa lentes los necesite o no. 

2.15 Una empresa de exploration petrolera encuentra petroleo o gas en 10% de sus perforaciones. Si la ern- 
presa perfora dos pozos, los cuatro posibles eventos simples y tres de sus probabilidades asociadas se 
dan en la tabla siguiente. Encuentre la probabilidad de que la compama encuentre petroleo o gas 

a en la primera perforation pero no en la segunda, 

b en al menos una de las dos perforaciones. 


Evento 

simple 

Resultado de la 
primera perforation 

Resultado de la 
segunda perforation 

Probabilidad 

Ei 

Encuentra (petroleo 0 gas) 

Encuentra (petroleo 0 gas) 

.01 

£2 

Encuentra 

No encuentra 

7 

£3 

No encuentra 

Encuentra 

.09 

£4 

No encuentra 

No encuentra 

.81 


2.16 De los voluntarios que entran en un centra de sangre, 1 en 3 tienen sangre 0 + , 1 en 15 tienen O , 1 en 
3 tienen A + y 1 en 16 tienen A - . El nombre de una persona que previamente ha donado sangre se selec- 
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ciona de los registros del centra. ^Cual es la probabilidad de que la persona seleccionada tenga 

a tipo de sangre 0 + ? 
b tipo de sangre O? 
c tipo de sangre A? 
d ni tipo A ni tipo O de sangre? 

2.17 Los trenes de aterrizaje hidraulicos que salen de una planta de reparation de aviones se inspeccionan 
para ver si tienen defectos. Registros historicos indican que 8% tienen defectos solo en ejes, 6% tienen 
defectos solo en bujes y 2% tienen defectos en ejes y bujes. Uno de los trenes hidraulicos se selecciona 
al azar. ^,Cual es la probabilidad de que el conjunto tenga 

a un buje defectuoso? 
b un eje o buje defectuoso? 
c exactamente uno de los dos tipos de defecto? 
d ningun tipo de defecto? 

2.18 Suponga que dos monedas balanceadas se tiran al aire y que se observan las caras superiores. 
a Indique los puntos muestrales para este experimento. 

b Asigne una probabilidad razonable a cada punto muestral. (^Los puntos muestrales son igualmente 
probables?) 

c Denote con A el evento de que exactamente se vea una cara y con B el evento de que se vea al rnenos 
una cara. Indique los puntos muestrales en A y B. 
d De su respuesta al inciso c, encuentre P(A), P(B), P(A OS), P(A UK) y P(A US). 

2.19 Una oficina de finanzas solicita suministros de papel de uno de tres vendedores, V 1 , V 2 o V 3 . Los pedidos 
han de colocarse en dos dlas sucesivos, un pedido por dla. Asf, (V 2 , V 3 ) podrla denotar que el vendedor 
V 2 obtiene el pedido en el primer dla y el vendedor V 3 obtiene el pedido en el segundo dla. 

a Indique los puntos muestrales en este experimento de solicitar papel en dos dfas sucesivos. 
b Suponga que los vendedores se seleccionan al azar cada dla y se asigna probabilidad a cada punto 
muestral. 

c Denote con A el evento de que el mismo vendedor obtenga ambos pedidos y B el evento de que V 2 
obtenga al menos un pedido. Encuentre P(A), P(B), P(A U S) y P(A D S) al suponer las probabili- 
dades de los puntos muestrales en estos eventos. 

*2.20 El siguiente juego se jugo en un conocido programa de television. El presentador mostro tres cortinas 
grandes a una concursante. Detras de una de las cortinas estaba un bonito premio (quiza un auto nuevo) 
y detras de las otras dos cortinas habla premios sin valor (falsos). A la concursante se le pidio escogiera 
una cortina. Si las cortinas eran identificadas por sus premios, podrian estar marcadas G, D x y D 2 (buen 
premio, falsol y falso2). Entonces, el espacio muestral para la selection de los concursantes es S = {G, 

d v d 2 }: 

a Si la concursante no dene idea de cuales cortinas ocultan los premios y selecciona una cortina al 
azar, asigne probabilidades razonables a los eventos sencillos y calcule la probabilidad de que la 
concursante seleccione la cortina que oculta el premio bueno. 
b Antes de mostrar a la concursante lo que estaba detras de la cortina inicialmente escogida, el pre¬ 
sentador del juego abrirfa una de las cortinas y mostrarla a la concursante uno de los premios sin 
valor (siempre podrla hacer esto porque sabe cual cortina oculta el premio bueno). Luego ofrecio a la 
concursante la option de cambiar de la cortina inicialmente seleccionada a la otra cortina restante no 
abierta. ^Cual estrategia lleva al maximo la probabilidad que tiene la concursante de ganar el premio 
bueno: quedarse con la option initial o cambiar a la otra cortina? Al contestar la siguiente secuencia 


1. Los ejercicios precedidos por un asterisco son opcionales. 
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de preguntas, listed descubrira que, quiza de una manera sorprendente, esta pregunta puede ser con- 
testada si se considera solo el espacio muestral citado antes y usar las probabilidades que asigno para 
contestar el inciso a. 

i Si la concursante escoge quedarse con su selection inicial, gana el premio bueno si y solo si 
inicialmente escogio la cortina G. Si se queda con su selection initial, ^cual es la probabilidad 
de que gane el premio bueno? 

ii Si el presentador le muestra uno de los premios sin valor y ella cambia a la otra cortina sin 
abrir, ^cual sera el resultado si inicialmente ella hubiera seleccionado G? 

iii Conteste la pregunta del inciso ii si ella inicialmente selecciono uno de los premios sin valor. 

iv Si la concursante cambia su selection inicial (como resultado de haberle sido mostrado uno de 
los premios sin valor), ^cual es la probabilidad de que la concursante gane el premio bueno? 

v ^Cual estrategia lleva al maximo la probabilidad de la concursante de ganar el premio bueno: 
quedarse con su selection inicial o cambiar a la otra cortina? 

*2.21 Si A y B son eventos, use el resultado obtenido en el Ejercicio 2.5(a) y los axiomas de la Definition 2.6 
para demostrar que 

P{A) = P{A OS) + P(A ns). 

*2.22 Si A y B son eventos y B C A, use el resultado obtenido en el Ejercicio 2.5(b) y los axiomas de la 
Definition 2.6 para demostrar que 

P{A) = P(B) + P(A n B). 

2.23 Si A y B son eventos yBCA, ^por que es “obvio” que P(B) £ P(A)1 

2.24 Use el resultado del Ejercicio 2.22 y los axiomas de la Definition 2.6 para demostrar el resultado 
“obvio” del Ejercicio 2.23. 


2.5 Calculo de la probabilidad de un evento: 
el metodo de punto muestral 

La probabilidad de un evento definido en un espacio muestral que contenga un conjunto de 
puntos muestrales finito o que se pueda contar aun cuando sea infinito, se puede calcular en 
dos formas: el metodo del punto muestral y el de la composicion de evento. Ambos metodos 
usan el modelo de espacio muestral, pero difieren en la secuencia de pasos necesaria para ob- 
tener una solution y en las herramientas que se usan. La separation de los dos procedimientos 
puede no ser agradable para el teorico que busca la unidad, pero puede ser sumamente util 
para un principiante que trate de hallar la probabilidad de un evento. En esta section conside- 
ramos el metodo de punto muestral. El metodo de composicion de eventos requiere resultados 
adicionales y se presentara en la Section 2.9. 
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El metodo de punto muestral se compendia en la Seccion 2.4. Los pasos siguientes se 
usan para hallar la probabilidad de un evento: 

1. Defina el experimento y determine con toda claridad como describir un evento 
simple. 

2. Indique los eventos simples asociados con el experimento y pruebe cada uno para 
asegurarse que no se pueden descomponer. Esto define el espacio muestral S. 

3. Asigne probabilidades razonables a los puntos muestrales en S, asegurandose de 
q ue P(Ei) > 0 y ££(£,) = 1. 

4. Defina el evento de interes, A, como un conjunto especifico de puntos muestrales. 
(Un punto muestral esta en A si A ocurre cuando se presenta el punto muestral. 
Pruebe todos los puntos muestrales en S para identificar los que esten en A.) 

5. Encuentre P(A) al sumar las probabilidades de los puntos muestrales en A. 


Ilustraremos estos pasos con tres ejemplos. 


EJ EMPLO 2.2 Considere el problema de seleccionar dos solicitantes para un trabajo, de un grupo de cinco 
solicitantes e imagine que estos varfan en grado de competencia, 1 siendo el mejor, 2 el segun- 
do mejor y as! sucesivamente para 3, 4 y 5. Estas clasificaciones son por supuesto desconoci- 
das para el empleador. Defina dos eventos Ay B como: 

A: El empleador selecciona al mejor y a uno de los dos solicitantes menos aptos (1 y 4 o 

i y 5). 

B: El empleador selecciona al menos uno de los dos mejores. 

Encuentre las probabilidades de estos eventos. 

Solucion Los pasos son como sigue: 

1. El experimento comprende seleccionar al azar dos solicitantes de entre cinco. Denote 
la seleccion de los solicitantes 3 y 5 por {3, 5}. 

2. Los diez eventos simples, con {i, j] denotando la seleccion de los solicitantes i y j, 
son 

3. Una seleccion aleatoria de dos de entre cinco da a cada par una probabilidad igual de 

£i: {1,2}, £ 5 : {2, 3}, £ 8 :{3, 4}, £ 10 :{4, 5}. 

£ 2 : {1,3}, £ 6 :{2, 4}, Eg: {3, 5}, 

£ 3 : {1,4}, £ 7 : {2, 5}, 

£ 4 : {1, 5}, 

seleccion. Por tanto, asignaremos a cada punto muestral la probabilidad 1/10. Esto 
es, 

£(£,) = 1/10 = . 1 , i = 1 , 2 ,..., 10. 

4. Al comprobar los puntos muestrales vemos que B se presenta siempre que se pre- 
sentan £ 1; £ 2 , £ 3 , £ 4 , £ 5 , £ 6 o £ 7 . En consecuencia, estos puntos muestrales estan 
incluidos en B. 





2.5 Calculo de la probabilidad de un evento: el metodo de punto muestral 37 


5. Por ultimo, £(£) es igual a la suma de las probabilidades de los puntos muestrales en 
B , o sea 


P(B) = Y,P(Ei) = J2 -1 = - 7 - 


Del mismo modo, vemos que el evento A = £3 U £4 y que £(A) = .1+.1 = .2. ■ 


La solucion de este y otros problemas semejantes serfa de importancia para el director de 
personal de una empresa. 


EJEMPLO 2.3 Una moneda balanceada se lanza tres veces al aire. Calcule la probabilidad de que exactamen- 
te dos de los tres tiros resulten en caras. 

Solucion Los cinco pasos del metodo de punto muestral son como sigue: 

1. El experimento consiste en observar los resultados (caras o cruces) para cada uno 
de los tres tiros de una moneda. Un evento simple para este experimento se puede 
simbolizar con una secuencia de tres letras H y T que representan caras y colas, 
respectivamente. La primera letra de la secuencia representa la observacion de la 
primera moneda. La segunda letra representa la observacion de la segunda moneda, 
y asi sucesivamente. 

2. Los ocho eventos simples en S son 

E \: HHH, E 3 :HTH, E 5 : HTT , £ 7 : TTH, 

E 2 :HHT , £ 4 : £////, E 6 :THT , £ g : TTT. 

3. Como la moneda esta balanceada, esperanamos que los eventos simples fueran exac- 
tamente probables; esto es, 

£(£,) = 1/8, i = 1,2,..., 8. 

4. El evento de interes. A, es el evento que resulta exactamente en que dos de los tiros 
sean caras. Un examen de los puntos muestrales verifica que 

A = {E 2 , £ 3 , £ 4 }. 

5. Por ultimo. 


P{A) = P(E 2 ) + £(£ 3 ) + £(£ 4 ) = 1/8 + 1/8 + 1/8 = 3/8. ■ 


Aun cuando los puntos muestrales de los espacios muestrales asociados con los Ejemplos 
2.2 y 2.3 son igualmente probables, es importante darse cuenta que los puntos muestrales no 
necesitan ser igualmente probables. Veamos ahora un ejemplo para ilustrar este punto. 
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EJEMPLO 2.4 

Solucion 


Las probabilidades son dos a uno de que, cuando Ay B juegan tenis, A gane. Suponga que A 
y B juegan dos partidos. ,' Cual es la probabilidad de que A gane al menos un partido? 

1. El experimento consiste en observar al ganador (A o B) de cada uno de los dos parti¬ 
dos. Denote con AB el evento de que el jugador A gane el primer duelo y el jugador 
B gane el segundo. 

2. El espacio muestral para el experimento consta de cuatro puntos muestrales: 

E\ : AA, £ 2 : AB , £ 3 : BA , £ 4 : BB 

3. Como A tiene una mejor probabilidad de gana cualquier partido, no parece apropiado 
asignar iguales probabilidades a estos puntos muestrales. Como se vera en la Seccion 
2.9, en ciertas condiciones es razonable hacer la siguiente asignacion de probabilida¬ 
des: 

£(£ 1 ) = 4/9, £(£ 2 ) = 2/9, £(£ 3 ) = 2/9, £(£ 4 ) = 1/9. 

Observe que, aun cuando las probabilidades asignadas a los eventos simples no son 
todas iguales, £(£, ) >0,para i = 1, 2, 3, 4 y J2s £(£/) = 1- 

4. El evento de interes es que A gana al menos un juego. Asf, si denotamos el evento de 
interes como C, facilmente se ve que 

C = E\ U £2 U £ 3 . 

5. Por ultimo, 

£(C) = £(£ 1 ) + £(£ 2 ) 4- £(£ 3 ) = 4/9 + 2/9 + 2/9 = 8/9. ■ 


El metodo de punto muestral para resolver un problema de probabilidades es directo y 
poderoso y en algunos aspectos es avasallador. Se puede aplicar para hallar la probabilidad de 
cualquier evento definido para un espacio muestral que contenga un conjunto finito o conta- 
ble de puntos muestrales, pero no es resistente al error humano. Los errores comunes inclu- 
yen diagnosticar de manera incorrecta la naturaleza de un evento simple y no indicar todos 
los puntos muestrales en S. Una segunda complication se presenta porque muchos espacios 
muestrales contienen un gran numero de puntos muestrales y un detallado completo es tedioso 
y lento y podrfa ser practicamente imposible. 

Por fortuna, numerosos espacios muestrales generados por datos experimentales contienen 
subconjuntos de puntos muestrales que son igualmente probables. (Los espacios muestrales 
para los Ejemplos 2.1, 2.2 y 2.3 poseen esta propiedad.) Cuando esto ocurre, no es necesario 
indicar los puntos pero podemos contar el numero de cada subconjunto. Si no se pueden apli¬ 
car estos metodos de conteo, debe usarse un metodo ordenado para indicar los puntos mues¬ 
trales (observense los esquemas de lista para los Ejemplos 2.1, 2.2 y 2.3). Enlistan numeros 
grandes de puntos muestrales se puede lograr con el uso de una computadora. 

Las herramientas que reducen el esfuerzo y error asociado con el metodo de punto muestral 
para hallar la probabilidad de un evento incluyen el sentido de orden, una computadora y la 
teorfa matematica de conteo llamada analisis combinatorio. La programacion y aplicaciones 
en computadora forman un tema de estudio por separado. La teorfa matematica de analisis 
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combinatorio tambien es un tema muy amplio, pero se pueden obtener resultados bastante 
utiles en forma breve. En consecuencia, nuestro siguiente tema se refiere a algunos resultados 
elementales en analisis combinatorio y su aplicacion al metodo de punto muestral para la so- 
lucion de problemas de probabilidad. 


Ejercicios 

2.25 Al azar se selecciona un solo auto de entre todos los registrados en una agenda local de placas. ^Que 
piensa usted de la siguiente frase? “Todos los autos son marca Volkswagen o no lo son. Por tanto, la 
probabilidad de que el auto seleccionado sea un Volkswagen es de 1/2.” 

2.26 Segun el Webster's New Collegiate Dictionary, una varilla adivinadora es “una barra en forma de hor- 
queta que se piensa indica (o adivina) la presencia de agua o minerales al inclinarse hacia abajo cuando 
se mantiene sobre una veta”. Para probar el dicho de un experto en varillas adivinadoras, unos escepticos 
entierran cuatro latas en el suelo, dos vatias y dos llenas de agua. El experto es llevado a las cuatro latas 
y se le dice que dos de ellas contienen agua. El usa la varilla adivinadora para probar cada una de las 
cuatro latas y decide cuales de ellas contienen agua. 

a Indique el espacio muestral para este experimento. 

b Si la varilla adivinadora es totalmente inutil para localizar agua, ^cual es la probabilidad de que el 
experto identifique en forma correcta (por adivinacion) las dos latas que contienen agua? 

2.27 En el Ejercicio 2.12 consideramos una situation en la que unos autos entran a un crucero y podria cada 
uno de ellos dar vuelta a la derecha, a la izquierda o seguir de frente. Un experimento consiste en obser- 
var dos vehfculos que pasan por el crucero. 

a ^Cuantos puntos muestrales hay en el espacio muestral? Indlquelos. 

b Suponiendo que todos los puntos muestrales sean igualmente probables, ^.cual es la probabilidad de 
que al rnenos un auto de vuelta a la izquierda? 

c De nuevo suponiendo puntos muestrales igualmente probables, ^,cual es la probabilidad de que a lo 
sumo un vehlculo de vuelta? 

2.28 Cuatro personas igualmente calificadas hacen solicitud para ocupar dos puestos identicos en una em- 
presa. Un y solo un solicitante es miembro de un grupo de minorla etnica. Los puestos se llenan al 
seleccionar dos de los solicitantes al azar. 

a Indique los posibles resultados para este experimento. 
b Asigne probabilidades razonables a los puntos muestrales. 

c Encuentre la probabilidad de que el solicitante del grupo etnico minoritario sea seleccionado para una 
position. 

2.29 Se necesitan dos jurados adicionales para completar un jurado para un juicio criminal. Hay seis jurados en 
perspectiva, dos mujeres y cuatro hombres. Dos de los jurados son seleccionados al azar de entre los 
seis disponibles. 

a Defina el experimento y describa un punto muestral. Suponga que es necesario describir solo los dos 
jurados seleccionados y no el orden en el que fueron elejidos. 
b Indique el espacio muestral asociado con este experimento. 
c ^Cual es la probabilidad de que los dos jurados seleccionados sean mujeres? 

2.30 Tres vinos importados van a ser clasificados de rnenos a mas por un experto en vinos. Esto es, un vino 
sera identificado como el mejor, otro como el segundo mejor y el vino restante como el peor. 

a Describa un punto muestral para este experimento. 
b Indique el espacio muestral. 

c Suponga que el “experto” no sabe en realidad nada de vinos y que al azar asigna el lugar a los tres 
vinos. Uno de los vinos es de rnucha mejor calidad que los otros. ^Cual es la probabilidad de que el 
experto no clasifique el mejor vino como peor que el segundo mejor? 
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2.31 Un furgon de ferrocarril contiene seis sistemas electronicos complejos. Dos de los seis se han de selec- 
cionar al azar para hacerles pruebas completas y luego clasificarlos como defectuosos o no defectuo- 
sos. 

a Si dos de los seis sistemas en realidad estan defectuosos, encuentre la probabilidad de que al menos 
uno de los dos sistemas probados sea defectuoso. Encuentre la probabilidad de que ambos sean de¬ 
fectuosos. 

b Si cuatro de los seis sistemas estan defectuosos en realidad, encuentre las probabilidades indicadas 
en el inciso a. 

2.32 Un detallista vende solo dos estilos de consolas estereo y la experiencia muestra que ambas tienen igual 
demanda. Cuatro clientes en sucesion entran a la tienda para comprar estereos. El vendedor esta intere- 
sado en sus preferencias. 

a Indique las posibilidades para arreglos de preferencia entre los cuatro clientes (esto es, indique el 
espacio muestral). 

b Asigne probabilidades a los puntos muestrales. 

c Denote con A el evento de que los cuatro clientes prefieran el mismo estilo. Encuentre P(A). 

2.33 La Oficina del Censo reporta que el ingreso familiar mediano para todas las familias en Estados Unidos, 
durante el ano 2003, fue $43,318. Esto es, la mitad de todas las familias estadounidenses tuvo ingresos 
que rebasaban esta cantidad y la mitad tuvo ingresos iguales o menores a esta cantidad. Suponga que se 
hace una encuesta a cuatro familias y que cada una de ellas revela si su ingreso rebaso los $43,318 en 
2003. 

a Indique los puntos del espacio muestral. 

b Identifique los eventos simples en cada uno de los eventos siguientes: 

A: al menos dos tuvieron ingresos de mas de $43,318. 

B: exactamente dos tuvieron ingresos de mas de $43,318. 

C: exactamente una tuvo ingresos menores o iguales a $43,318. 
c Haga uso de la interpretation dada para la mediana para asignar probabilidades a los eventos simples 
y encuentre P(A), P(B) y P(C). 

2.34 Los pacientes que llegan a una clmica para atencion externa pueden seleccionar una de tres estaciones 
de servicio. Suponga que los medicos se asignan al azar a las estaciones y que los pacientes por tanto no 
tienen preferencia de estacion. Tres pacientes llegan a la clmica y se observa su selection de estacion. 
a Indique los puntos muestrales para el experimento. 

b Sea A el evento de que cada estacion recibe a un paciente. Indique los puntos muestrales en A. 
c Haga una asignacion razonable de probabilidades a los puntos muestrales y encuentre P(A). 


2.6 Herramientas para contar puntos muestrales 

Esta section presenta algunos resultados utiles de la teorfa de analisis combinatorio e ilustra 
la aplicacion de ellos al metodo de punto muestral para hallar la probabilidad de un evento. En 
muchos casos estos resultados hacen posible contar el numero total de puntos muestrales en el 
espacio muestral S y en un evento de interes, con lo cual dan una confirmation de la lista de 
eventos simples. Cuando el numero de eventos simples de un espacio muestral es muy grande 
y la enumeration manual de todo punto muestral es tediosa o hasta imposible, contar el nu¬ 
mero de puntos del espacio muestral y del evento de interes puede ser la unica forma eficiente 
de calcular la probabilidad de un evento. De hecho, si un espacio muestral contiene N puntos 
muestrales igualmente probables y un evento A contiene exactamente n a puntos muestrales, es 
facil ver que P(A ) = nJN. 
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FIGURA 2.9 
Tabla que indica 
el numero de pares 
(a,/ bj) 


a, a~ a~ a 

12 3 m 




El primer resultado del analisis combinatorio que presentamos, a veces llamado regia mn, 
se expresa como sigue: 


TEOREMA 2.1 


Demostracion 


La regia mn puede ser extendida a cualquier numero de conjuntos. Dados tres conjuntos 
de elementos a\, az,..., a m \ bi, bi, ■ ■ ■, b n \ y c\, C 2 ,..., c p el numero de ternas distintas 
que contienen un elemento de cada conjunto es igual a mnp. La prueba del teorema para 
tres conjuntos invulucra dos aplicaciones del Teorema 2.1. Consideramos el primer conjunto 
como un par (a t , bp y unimos cada uno de estos pares con elementos del tercer conjunto, c v 
c 2 ,..., c p . El Teorema 2.1 implica que hay mn pares (a t , bp. Como hay p elementos c ,, c„..., 
c p , otra aplicacion del Teorema 2.1 implica que hay ( mri)(p ) = mnp ternas a-b f c k . 


Con m elementos a v a 2 ,..., a m y n elementos b x , b 0 ,, b n , es posible formar mn = 
m x n pares que contengan un elemento de cada grupo. 

La verificacion del teorema se puede ver al observar la tabla rectangular de la Ligura 2.9. 
Hay un cuadro de la tabla para cada par a t , b -y por tanto un total de m x n cuadros. 


EJ EMPLO 2.5 Un experimento incluye lanzar un par de dados y observar los numeros de sus caras superio- 
res. Encuentre el numero de puntos muestrales en .S', el espacio muestral para el experimento. 

Solucion Un punto muestral para este experimento puede ser representado simbolicamente como un 
par ordenado de numeros que representan los resultados en el primero y segundo dados, res- 
pectivamente. Asl, (4, 5) denota el evento de que la cara superior del primer dado fue un 4 y en 
el segundo dado, un 5. El espacio muestral S esta formado por el conjunto de todos los pares 
posibles (x, y), donde x y y son ambos enteros entre 1 y 6. 

El primer dado puede resultar en uno de seis numeros. Estos representan a v a 2 ,..., a 6 . 
De igual modo, el segundo dado puede caer en una de seis formas y estas corresponden a 
b { , b 2 ,..., b 6 . Entonces m = n = 6 y el numero total de puntos muestrales en S es mn = 
(6)(6) = 36. ■ 


EJEMPLO 2.6 Consulte el experimento de lanzar al aire una moneda del Ejemplo 2.3. Encontramos para este 
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ejemplo que el numero total de puntos muestrales era ocho. Use la extension de la regia mn 
para confirmar este resultado. 

Solucion Cada punto muestral en S fue identificado por una secuencia de tres letras, cada position de la 
secuencia contenfa una de dos letras, una H o una T. El problema entonces implica la forma- 
cion de ternas, con un elemento (una H o una T) de cada uno de los tres conjuntos. Para este 
ejemplo, los conjuntos son identicos y todos contienen dos elementos (// y T). Asf, el numero 
de elementos en cada conjunto es m = n = p = 2, y el numero total de ternas que se puede 
formar es mnp = (2) 3 = 8. ■ 


EJEMPLO 2.7 Considere un experimento que consiste en registrar el cumpleanos para cada una de 20 per¬ 
sonas seleccionadas al azar. Si no se presta atencion a los anos bisiestos y se supone que hay 
solo 365 cumpleanos distintos posibles, encuentre el numero de puntos del espacio muestral S 
para este experimento. Si suponemos que cada uno de los posibles conjuntos de cumpleanos 
es igualmente probable, ( ' cual es la probabilidad de que cada persona de las 20 tenga un cum¬ 
pleanos diferente? 


Solucion Numere los dfas del ano como 1,2,..., 365. Un punto muestral para este experimento puede 
ser representado por una sucesion ordenada de 20 numeros, donde el primer numero denota 
el numero del dfa que es el cumpleanos de la primera persona, el segundo numero implica el 
numero del dla que es el cumpleanos de la segunda persona, y asf sucesivamente. Estamos 
interesados en el numero de veintenas que se pueden formar, seleccionando un numero que 
represente uno de los 365 dfas del ano para cada uno de los 20 conjuntos. Los conjuntos son 
todos identicos y cada uno contiene 365 elementos. Aplicaciones repetidas de la regia mn nos 
dice que hay (365) 20 de tales veintenas. Entonces, el espacio muestral S contiene N = (365) 20 
puntos muestrales. Aun cuando no podrfamos de manera factible hacer una lista de todos 
los puntos muestrales, sf suponemos que son igualmente probables, P(£j) = l/(365) 20 para 
cada evento simple. 

Si denotamos por A el evento de que cada persona tenga un cumpleanos diferente, la pro¬ 
babilidad de A se puede calcular si podemos determinar n a , el numero de puntos muestrales 
en A. Un punto muestral esta en A si la correspondiente veintena es tal que no hay dos posi- 
ciones que contengan el mismo numero. Entonces, el conjunto de numeros del cual se puede 
seleccionar el primer elemento en la veintena de A contiene 365 numeros, el conjunto del cual 
se puede seleccionar el segundo elemento contiene 364 elementos (todos excepto el seleccio- 
nado para el primer elemento), el conjunto del cual se puede seleccionar el tercero contiene 
363 (todos excepto los dos seleccionados para los primeros dos elementos),... y el conjunto 
del cual se puede seleccionar el vigesimo elemento contiene 346 elementos (todos excepto los 
seleccionados para los primeros 19 elementos). Una extension de la regia mn dara 

n a = (365) X (364) X • • • X (346). 

Por ultimo, podemos determinar que 


P(A) 


na 

N 


365 X 364 X ■■■ X 346 
(365P 


.5886. 
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DEFINICION 2.7 

TEOREMA 2.2 

Demost radon 


EJEMPLO 2.8 

Solution 


Observe que para los Ejemplos 2.5 y 2.6 los numeros de puntos muestrales en los respecti- 
vos espacios muestrales son ambos relativamente pequenos y que las listas para estos espacios 
muestrales podrfan escribirse con facilidad. Para ejemplos como estos, la regia mn proporcio- 
na un metodo simple para verificar que los espacios muestrales contienen el numero correcto 
de puntos. En contraste, no es factible hacer una lista del espacio muestral en el Ejemplo 2.7. 
No obstante, la regia mn se puede usar para contar el numero de puntos muestrales en .S' y en 
el evento de interes, permitiendo el calculo de la probabilidad del evento. 

Hemos visto que los puntos muestrales asociados con un experimento a veces pueden re- 
presentarse de manera simbolica como una sucesion de numeros o sfmbolos. En algunos casos 
sera evidente que el numero total de puntos muestrales es igual al numero de formas distintas 
en que los respectivos sfmbolos se pueden acomodar en sucesion. El siguiente teorema se 
puede usar para determinar el numero de arreglos ordenados que se pueden formar. 


Un arreglo ordenado de r objetos distintos se denomina permutation. El numero de formas 
de ordenar n objetos distintos tornados r a la vez estara designado por el sfmbolo P". 


P" =n(n-l)(n-2)---(n-r + 1) = . 

(n — r )\ 

Estamos interesados en el numero de formas de llenar r posiciones con n objetos distintos. 
Aplicando la extension de la regia mn , vemos que el primer objeto se puede seleccionar 
en una de n formas. Despues de escoger el primero, el segundo se puede escoger en (n 
- 1) formas, el tercero en (it — 2) y el r-esimo en (n - r + 1) formas. En consecuencia, 
el numero total de arreglos distintos es 

P" = n(n — 1 )(n — 2) ■•■(«— r + 1). 

Expresado en terminos de factoriales, 

P; = „(„ - 1)(„ — 2).■ (n — r + 1 )|ZU = 
donde n\ = n(n -!)••• (2)(1) y 0! = 1. 


Los nombres de 3 empleados se han de sacar al azar, sin restitution, de un tazon que contiene 
los nombres de 30 empleados de una pequena companfa. La persona cuyo nombre sea sacado 
primero recibe $100 y aquellos cuyos nombres se saquen en segundo y tercero recibiran $50 
y $25, respectivamente. ^Cuantos puntos muestrales estan asociados con este experimento? 

Debido a que los premios otorgados son diferentes, el numero de puntos muestrales es el nume¬ 
ro de arreglos ordenados de r = 3 de entre los posibles n = 30 nombres. Entonces, el numero 
de puntos muestrales en S es 

30 1 

p i° = ^T\ = ( 3 °)( 29 )( 28 ) = 24 ’ 360 - " 
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EJEMPLO 2.9 


Solucion 


TEOREMA 2.3 


Demostracion 


Suponga que una operation de ensamble en una planta de manufacturas consta de cuatro pa- 
sos que se pueden efectuar en cualquier secuencia. Si el fabricante desea comparar el tiempo 
de ensamble para cada una de las secuencias, ( : ,cuantas secuencias diferentes estaran involu- 
cradas en el experimento? 

El numero total de secuencias es igual al numero de formas de acomodar los n = 4 pasos 
tornados r = 4 a la vez, o sea 


p 4 

. 


4! 4! 

- = — = 24. 

4-4! 0! 


El siguiente resultado de analisis combinatorio se puede usar para determinar el numero 
de subconjuntos de varios tamanos que se pueden formar al dividir un conjunto de n objetos 
distintos en k grupos que no se traslapen. 


El numero de formas de dividir n objetos distintos en k grupos distintos que contienen 
n t , n 2 ,, n k objetos, respectivamente, donde cada objeto aparece en exactamente un 
gmpo y J2 k l = [ rij = n, es 

/ n \ n\ 

N = = -. 

\«i n 2 ■ ■ ' n k J n\ \ n 2 \ ■ ■ ■ n k \ 

N es el numero de arreglos distintos de n objetos en una fila para un caso en el que el 
reacomodo de los objetos dentro de un grupo no cuenta. Por ejemplo, las letras de la a 
a la / estan acomodadas en tres grupos, donde n, = 3, n 2 = 4 y n 3 = 5: 

abc\de\f\g\hijkl 

es uno de estos arreglos. 

El numero de arreglos distintos de los n objetos, suponiendo que todos los obje¬ 
tos sean distintos, es P" = n ! (del Teorema 2.2). Entonces P" es igual al numero de 
formas de dividir los n objetos en k grupos (ignorando el orden dentro de los grupos) 
multiplicado por el numero de formas de ordenar los n v n 2 , ..., n k elementos dentro de 
cada gmpo. Esta aplicacion de la regia mn extendida da 

P" = (AO • («i! n 2 \ n 2 \ ■ ■ -n k \), 

donde n t \ es el numero de arreglos distintos de los n i objetos del grupo i. 

Al despejar N , tenemos 

n ! / n \ 

N = - = 

n\\n 2 \ ■ ■ -n k \ \n i n 2 ■ ■ ■ n k J 
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EJEMPLO 2.10 


Solucion 


Los terminos 


n n .. n ^ se denominan coeficientes multinomiales porque se presentan en 


la expansion del termino multinomial Vj + y 2 + 

(yi + yi +- ^y'k) n = ^2 


+ y k elevada a la n potencia: 
n 


n\ n2 nk 


n i n? n k 

^ y 2 . 


donde esta suma se toma sobre toda n,- = 0, 1,..., n tal que + n 2 + 


+n t = n. 


Ha surgido una disputa laboral respecto a la distribucion de 20 trabajadores a cuatro trabajos 
de construction diferentes. El primer trabajo (considerado muy indeseable) requirio de 6 tra¬ 
bajadores; el segundo, tercero y cuarto utilizaron 4, 5 y 5 trabajadores, respectivamente. La 
disputa surgio sobre una supuesta distribucion aleatoria de los trabajadores a los trabajos que 
pusieron a los 4 miembros de un grupo etnico particular en el trabajo 1. A1 considerar si la 
asignacion representaba una injusticia, un panel de mediation pedfa la probabilidad del evento 
observado. Determine el numero de puntos muestrales del espacio muestral S para este expe- 
rimento. Esto es, determine el numero de formas en que los 20 trabajadores se pueden dividir 
en grupos de los tamanos apropiados para llenar todas las posiciones de trabajo. Encuentre la 
probabilidad del evento observado si se supone que los trabajadores son asignados en forma 
aleatoria a los trabajos. 


El numero de formas de asignar los 20 trabajadores a los cuatro trabajos es igual al numero de 
formas de dividir los 20 en cuatro grupos de tamanos n l = 6, n 2 = 4, n 3 = n 4 = 5. Entonces 


N = 


20 

645 5 


20 ! 

6! 4! 5! 5! 


Por una asignacion aleatoria de trabajadores a los trabajos queremos decir que cada uno de 
los A puntos muestrales tiene probabilidad igual a 1 IN. Si A denota el evento de interes y n c el 
numero de puntos muestrales en A, la suma de las probabilidades de los puntos muestrales en 
A es P(A ) = n a ( 1 IN) = nJN. El numero de puntos muestrales en A, n a , es el numero de formas 
de asignar trabajadores a los cuatro trabajos, con los 4 miembros del grupo etnico pasando to- 
dos al trabajo 1. Los 16 trabajadores restantes necesitan ser asignados a los trabajos restantes. 
Debido a que quedan dos vacantes para el trabajo 1, esto se puede hacer en 


formas. Se deduce que 


16 

245 5 


16! 

2! 4! 5! 5! 


P(A) = — = 0.0031. 
N 


Entonces, si los trabajadores se asignan al azar a los trabajos, la probabilidad de que los 4 
miembros del grupo etnico pasen al trabajo indeseable es muy pequena. Hay razones para 
dudar de que los trabajos se asignaron al azar. ■ 


En muchas situaciones los puntos muestrales son identificados por un conjunto de sfmbo- 
los en los que el arreglo de sfmbolos no es importante. Los puntos muestrales para la seleccion 
de solicitantes, Ejemplo 2.2, implica una seleccion de dos solicitantes de entre cinco. Cada 






46 Capftulo2 Probabilidad 


punto muestral es identificado como un par de sfmbolos y el orden de los sfmbolos empleados 
para identificar los puntos muestrales no es importante. 


D E FI N I C 1 6 N 2.8 El numero de combinaciones de n objetos tornados r a la vez es el numero de subconjun- 
tos, cada uno de tamano r, que se pueden formar a partir de los n objetos. Este numero 
estara denotado por C" o ("). 


TEOREMA 2.4 El numero de subconjuntos desordenados de tamano r escogidos (sin restitution) de n 
objetos disponibles es 

_ p " _ « ! 
r ! r !(n — r)\ 

Demostracion La selection de r objetos de un total de n objetos es equivalente a dividir los n objetos 
en k = 2 grupos, los r seleccionados y los (n - r) restantes. Este es el caso especial del 
problema general de division tratado con el Teorema 2.3. En el presente caso, k = 2, 
n i = r y n 2 = (n - r) y, por tanto, 

n \ n\ 

r n — r J r\(n — r)l 




Los terminos se conocen generalmente como coeficientes binomiales porque se presen- 
tan en la expansion binomial 


(x + y)" = n *V + 


0/ ' U 

1 / 

n 

\ 

=o 


n 1 1 


y 1 + 


n- 2.,2 


H-+ 


x°y" 


= S “b-v. 


EJEMPLO 2.11 Encuentre el numero de formas de seleccionar dos solicitantes de entre cinco y por tanto el 
numero total de puntos muestrales en S para el Ejemplo 2.2. 

Solution = 10. 

\2J 2!3! 

(Observe que este esta acorde con el numero de puntos muestrales indicados en el Ejemplo 

2.2.) ■ 


EJEMPLO 2.12 Denote con A el evento de que exactamente uno de los dos mejores solicitantes aparezca en 
una selection de dos de entre cinco. Encuentre el numero de puntos muestrales en A y P(A). 

Solution Denote con n a el numero de puntos muestrales en A. Entonces n a es igual al numero de formas 
de seleccionar uno de los dos mejores (llame m a este numero) multiplicado por el numero de 
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formas de seleccionar uno de los tres solicitantes de baja calificacion (llame n a este numero). 
Entonces m = (^), n = (|) y, aplicando la regia mn. 


'2\ /3\ 2! 3 

1/ ' Vl/ Tm ’ U2 


(Este numero se puede verificar al contar los puntos muestrales en A de la lista del Ejemplo 2.2.) 

En el Ejemplo 2.11 hallamos que el numero total de puntos muestrales en S es N = 10. Si 
cada selection es igualmente probable, P(E t ) = 1/10 = .1, i = 1, 2,...,10 y 

P(A) = P(Ej) = £(.l) = n a (. 1) = 6(.l) = .6. u 

EjdA EjfZA 


EJEMPLO 2.13 Una empresa compra abastecimientos a M distribuidores y desea colocar n pedidos (n < M). 

Suponga que la empresa coloca los pedidos en forma que permita a cada distribuidor tener 
igual probabilidad de obtener cualquier pedido y no hay restriction en el numero de pedidos 
que se puedan colocar con cualquier distribuidor. Encuentre la probabilidad de que un distri¬ 
buidor particular, por ejemplo el distribuidor I, obtenga exactamente k pedidos (k < n). 


Solution Como cualquiera de los M distribuidores puede ser seleccionado para recibir cualquiera de los 
pedidos, hay M formas en que cada pedido se pueda colocar y el numero de formas diferentes 
en que los n pedidos se pueden colocar es M • M • M • ■ ■ = (M)". En consecuencia, hay (M) n 
puntos muestrales en S. Todos estos puntos son igualmente probables; en consecuencia, P(E ; ) 
= 1/(M)". 

Denote con A el evento de que el distribuidor I reciba exactamente k pedidos de entre los n. 
Los k pedidos asignados al distribuidor I se pueden seleccionar de los n en (" j formas. Resta 
determinar el numero de formas en que los restantes (n - k ) pedidos se puedan asignar a los 
otros M - 1 distribuidores. Como cada uno de estos (n - k) pedidos pueden ir a cualquiera de 
los (M- 1) distribuidores, esta asignacion se puede hacer en (M- 1)' I_A formas. Entonces, A 
contiene 


n a = I^KM-ir 


puntos muestrales, y como los puntos muestrales son igualmente probables, 


Ej CA 


E,<ZA 


M" 


Los Teoremas 2.1a 2.4 dan algunas de las numerosas y utiles formas de conteo halladas en 
la teorfa de analisis combinatorio. Unos cuantos teoremas adicionales aparecen en los ejerci- 
cios al final de este capitulo. Si el lector esta interesado en ampliar su conocimiento de analisis 
combinatorio, consulte uno de los numerosos textos sobre este tema. 

A continuation dirigiremos nuestra atencion al concepto de probabilidad condicional. La 
probabilidad condicional desempena un importante papel en el metodo de composition de 
eventos para hallar la probabilidad de un evento y en ocasiones es util para hallar las proba- 
bilidades de puntos muestrales (para espacios muestrales con puntos muestrales que no son 
igualmente probables). 
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Ejercicios 

2.35 Una lfnea aerea tiene seis vuelos de Nueva York a California y siete vuelos de California a Hawai 
diarios. Si los vuelos se han de hacer en dfas separados, ^cuantos arreglos diferentes de vuelos puede 
ofrecer la lfnea aerea de Nueva York a Hawai? 

2.36 Una operation de ensamble en una planta de manufacture requiere tres pasos que se pueden realizar en 
cualquier secuencia. ^,En cuantas formas diferentes se puede efectuar el ensamble? 

2.37 Una mujer de negocios de Filadelfia esta preparando su itinerario para una visita a seis ciudades irnpor- 
tantes. La distancia recorrida y por tanto el costo del viaje, dependent del orden en que ella planee su 
ruta. 

a ^Cuantos itinerarios diferentes (y costos de viaje) son posibles? 

b Si la mujer selecciona al azar uno de los posibles itinerarios y Denver y San Francisco son dos de las 
ciudades que ella piensa visitar, ^cual es la probabilidad de que visite Denver antes de San Francisco? 

2.38 Un restaurante de nivel economico alto ofrece un menu especial de precios fijos en el que, por un costo 
fijo de comidas, una persona puede seleccionar de entre cuatro aperitivos, tres ensaladas, cuatro entradas 
y cinco postres. ^Cuantas comidas diferentes hay si una de ellas consta de un aperitivo, una ensalada, 
una entrada y un postre? 

2.39 Un experimento consiste en tirar un par de dados. 

a Use los teoremas combinatorios para determinar el numero de puntos muestrales del espacio 
muestral S. 

b Encuentre la probabilidad de que la suma de los numeros que aparezcan en el dado sea igual a 7. 

2.40 Una marca de automovil viene en cinco estilos diferentes, con cuatro tipos de motor, con dos tipos de 
transmisiones y en ocho colores. 

a ^Cuantos autos tendrfa que tener en existencia un distribuidor si incluyera uno por cada combination 
de estilo, motor y transmision? 

b ^Cuantos tendrfa que tener en existencia un centra de distribution si todos los colores de autos se 
tuvieran para cada combination del inciso a? 

2.41 ),Cuantos numeros telefonicos diferentes de siete dfgitos se pueden formar si el primer dfgito no puede 
ser cero? 

2.42 La directora de personal de una corporation ha contratado diez nuevos ingenieros. Si tres puestos de 
trabajo (muy distintos) se abren en una planta en Cleveland, ien cuantas formas puede ella ocupar los 
puertos? 

2.43 Una flota de nueve taxis se ha de despachar a tres aeropuertos en forma tal que tres vayan al aeropuerto 
A, cinco al aeropuerto B y uno al aeropuerto C. ^En cuantas formas distintas se puede lograr esto? 

2.44 Consulte el Ejercicio 2.43. Suponga que los taxis son asignados a aeropuertos al azar. 

a Si exactamente uno de los taxis necesita reparation, ),cual es la probabilidad de que sea despachado 
al aeropuerto C? 

b Si exactamente tres de los taxis necesitan reparation, ^cual es la probabilidad de que cada aeropuerto 
reciba uno de los taxis que necesita reparation? 

2.45 Suponga que deseamos expandir (x + y + z) 17 . ^Cual es el coeficiente de xVz 10 ? 
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2.46 Diez equipos estan jugando en un torneo de baloncesto. En la primera ronda, a los equipos se les asignan 

al azar los juegos 1, 2, 3, 4 y 5. ^En cuantas formas pueden ser asignados los equipos a los juegos? 

*2.47 Consulte el Ejercicio 2.46. Si 2 n equipos van a ser asignados a los juegos 1,2,..., n , ^,en cuantas formas 
pueden ser asignados los equipos a los juegos? 

2.48 Si deseamos expandir (x + y) 8 , £cual es el coeficiente de x 5 v 3 ? (,Cual es el coeficiente de A J y 5 ? 

2.49 Los estudiantes que asisten a clase en la Universidad de Florida pueden seleccionar de entre 130 disci- 
plinas de posgrado. El posgrado de un estudiante se identifica en los registros del secretario general de 
la universidad con un codigo de dos o tres letras (por ejemplo, los posgrados en estadfstica se identifican 
con STA, los de matematicas con MS ). Algunos estudiantes optan por dos posgrados y completan los 
requisitos para ambos antes de graduarse. Al secretario general se le pidio considere asignar a estos dos 
posgrados un codigo diferente de dos o tres letras para que puedan ser identificados en el sistema de 
registro del estudiante, 

a ^Cual es el numero maximo de posibles posgrados dobles disponibles para estudiantes de la 
Universidad de Florida? 

b Si existe cualquier codigo de dos o tres letras para identificar posgrados individuales o dobles, ^,de 
cuantos codigos de posgrado se dispone? 

c ^Cuantos codigos de posgrado se requieren para identificar estudiantes que tienen ya sea un posgrado 
individual o uno doble? 

d r,Hay suficientes codigos de posgrado para identificar todos los posgrados individuales o dobles en la 
Universidad de Florida? 

2.50 La probabilidad desempeno un papel en la manipulation de la loteria del estado de Pennsylvania del 24 de 
abril de 1980 (Los Angeles Times, 8 de septiembre de 1980). Para determinar cada uno de los dlgitos del 
numero ganador de tres dlgitos, cada uno de los numeros 0.1,2,..., 9 se coloca en una pelota de ping-pong, 
las diez pelotas se agitan con aire en un compartimento y el numero seleccionado para el dlgito es el 
de la bola que flota a la parte superior de la maquina. Para alterar las probabilidades, los conspiradores 
inyectaron un llquido en todas las bolas empleadas en el juego excepto las que tenlan los numeros 4 y 6, 
haciendo casi seguro que las bolas mas livianas fueran seleccionadas y determinar los dlgitos del numero 
ganador. Luego compraron billetes de loteria con los potenciales numeros ganadores. ^Cuantos numeros 
ganadores potenciales hubo (al final 666 fue el ganador)? 

2.51 Una fraternidad local esta realizando una rifa en la que se han de vender 50 boletos, uno por cliente. Hay 
tres premios para ser concedidos. Si los cuatro organizadores de la rifa compran un boleto cada uno. 
^cual es la probabilidad de que los cuatro organizadores ganen 

a todos los premios?, 

b exactamente dos de los premios?, 

c exactamente uno de los premios?, 

d ninguno de los premios? 

2.52 Un experimentador desea investigar el efecto de tres variables: presion, temperatura y tipo de cataliza- 
dor en el rendimiento de un proceso de refinacion. Si el experimentador trata de usar tres ajustes, cada 
uno para temperatura y presion y dos tipos de catalizadores, ^cuantas series experimentales tendran 
que ejecutarse si el desea realizar todas las posibles combinaciones de presion, temperatura y tipos de 
catalizadores? 

2.53 Cinco compafuas, F v F 2 , ..., F 5 , ofrecen cotizaciones para tres contratos separados Cj, C 2 y C 3 . A 
cualquiera de las firmas se le otorgara un contrato a lo sumo. Los contratos son muy diferentes, de modo 
que una asignacion de Cj a Fj, por ejemplo, debe ser distinta de una asignacion de C 2 a Fj. 
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a ^Cuantos puntos muestrales hay en total en este experimento que involucra la asignacion de contratos 
a las firmas? (No es necesario indicarlos todos.) 

b Dada la suposicion de puntos muestrales igualmente probables, encuentre la probabilidad de que a F } 
se le conceda un contrato. 

2.54 Hay un grupo de tres pasantes y cinco estudiantes egresados para ocupar ciertos puestos gubernamenta- 
les para estudiantes. Si cuatro estudiantes se han de seleccionar al azar de entre este grupo, encuentre la 
probabilidad de que exactamente dos pasantes se encuentren entre los cuatro seleccionados. 

2.55 Se ha de realizar un estudio en un hospital para determinar las actitudes de los enfermeros hacia diversos 
procedimientos administrativos. Se ha de seleccionar una muestra de 10 enfermeros de entre un total de 
90 enfermeros empleadas por el hospital. 

a ^Cuantas muestras diferentes de 10 enfermeros se pueden seleccionar? 

b Veinte de los 90 enfermeros son hombres. Si 10 enfermeros se seleccionan al azar entre los emplea- 
dos por el hospital, £cual es la probabilidad de que la muestra de diez incluira exactamente 4 hombres 
(y 6 mujeres) enfermeros? 

2.56 Una estudiante se prepara para un examen estudiando una lista de diez problemas. Ella puede resolver 
seis de ellos. Para el examen, el profesor selecciona cinco problemas al azar de los diez de la lista dada 
a los estudiantes. ^Cual es la probabilidad de que la estudiante pueda resolver los cinco problemas del 
examen? 

2.57 Se sacan dos cartas de una baraja estandar de 52 cartas. ^Cual es la probabilidad de obtener un as y una 
figura? 

2.58 Se reparten cinco cartas de una baraja de 52 cartas. ^Cual es la probabilidad de sacar 
a 3 ases y 2 reyes?, 

b un “full” (tres cartas de una clase, 2 cartas de otra clase)? 

2.59 Se reparten cinco cartas de una baraja de 52 cartas. ^Cual es la probabilidad de sacar 

a 1 as, 1 dos, 1 tres, 1 cuatro y 1 cinco (esta es una forma de obtener una “escalera”)?, 
b cualquier escalera? 

2.60 Consulte el Ejemplo 2.7. Suponga que registramos el nacimiento para cada una de las n personas selec- 
cionadas al azar. 

a Escriba una expresion para la probabilidad de que ninguna comparta el mismo cumpleanos. 

b ^Cual es el valor mas pequeno de n para que la probabilidad sea al menos .5 de que como mini mo dos 
personas comparten el mismo cumpleanos? 

2.61 Suponga que preguntamos a n personas seleccionadas al azar si cumplen anos el mismo dfa que usted. 

a Escriba una expresion para la probabilidad de que nadie comparta su cumpleanos con usted (pase por 
alto los anos bisiestos). 

b ^Cuantas personas es necesario seleccionar para que la probabilidad sea al menos .5 de que como 
mfnimo una comparta cumpleanos con usted? 

2.62 Un fabricante tiene nueve motores distintos en existencia, dos de los cuales llegaron de un proveedor en 
particular. Los motores deben dividirse entre tres lmeas de produccion, con tres motores pasando a cada 
lrnea. Si la asignacion de motores a lfneas es aleatoria, encuentre la probabilidad de que arnbos motores 
del proveedor particular sean asignados a la primera lfnea. 

2.63 Los ocho miembros del Consejo Asesor de Relaciones Humanas de Gainesville, Florida, considero la 
queja de una rnujer que alegaba discriminacion, basada en su genero, de parte de una empresa local. 
El Consejo, compuesto de cinco mujeres y tres hombres, voto 5-3 a favor de la quejosa, con las cinco 



2.7 Probabilidad condicional y la independencia de eventos 51 


mujeres votando a favor de ella y los tres hombres en contra. El abogado que representaba a la companla 
apelo la decision del Consejo reclamando sesgo de genero de parte de los miembros del Consejo. Si no 
hubo sesgo de genero entre los miembros del Consejo, podrfa ser razonable hacer conjeturas de que serfa 
probable que cualquier grupo de cinco miembros votara a favor de la quejosa como lo harfa cualquier 
otro grupo de cinco. Si este fuera el caso, ^cual es la probabilidad de que el voto se dividiera por lineas 
de genero (cinco mujeres a favor, tres hombres en contra)? 

2.64 Un dado balanceado se tira seis veces y cada vez se registra el numero de su cara superior, ^Cual es la 
probabilidad de que los numeros registrados sean 1, 2, 3, 4, 5 y 6 en cualquier orden? 

2.65 Consulte el Ejercicio 2.64. Suponga que el dado ha sido alterado para que las caras sean 1, 2, 3, 4, 5 y 5. 
Si el dado se tira cinco veces, ^,cual es la probabilidad de que los numeros registrados sean 1, 2, 3, 4 y 5 
en cualquier orden? 

2.66 Consulte el Ejemplo 2.10. ^Cual es la probabilidad de que 

a el miembro de un grupo etnico sea asignado a cada tipo de trabajo?, 
b no se asigne ningun miembro de un grupo etnico a un trabajo tipo 4? 

2.67 Consulte el Ejemplo 2.13. Suponga que el numero de distribuidores es M = 10 y que hay n — 1 pedidos 
por ser colocados. ^Cual es la probabilidad de que 

a todos los pedidos vayan a distribuidores diferentes?, 

*b el distribuidor I obtenga exactamente dos pedidos y el distributor II obtenga exactamente tres pedidos?, 

*c los distribuidores I, II y III obtengan exactamente dos, tres y un pedido(s), respectivamente? 

2.68 Demuestre que, para cualquier entero n > 1, 
a ()|) = 1. Interprete este resultado. 

b (") = 1. Interprete este resultado. 
c (") = Interprete este resultado. 

n 

d E 

i=0 

2.69 Demuestre que 


= 2". [Sugerencia: considere la expansion binomial de (x + y) n con x — y = 1.] 


*2.70 Considere la situation en la que n artlculos sehande dividir en k < n subconjuntos distintos. Loscoeficien- 

tes multinomiales ^ n " ^ J dan el numero de particiones distintas donde n l artlculos estan en el grupo 

1, n 2 estan en el grupo 2,..., n k estan en el grupo k. Demuestre que el numero total de particiones dis¬ 
tintas es igual a k n . [Sugerencia: recuerde el Ejercicio 2.68(d).] 


2.7 Probabilidad condicional 

y la independencia de eventos 

La probabilidad de un evento en ocasiones depende de si sabemos que han ocurrido otros 
eventos. Por ejemplo, los Pescadores deportivos de Florida estan vitalmente interesados en la 
probabilidad de lluvia. La probabilidad de lluvia en un dfa determinado, si no se hace caso de 
las condiciones atmosfericas diarias o de otros eventos, es la fraccion de dfas en los que hay 
lluvia en un largo periodo. Esta es la probabilidad incondicional del evento “lluvia en un dfa 
determinado”. Ahora suponga que deseamos considerar la probabilidad de lluvia manana. 
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Ha llovido casi continuamente durante dos dfas seguidos y una tormenta tropical se aproxi- 
ma por la costa. Tenemos informacion adicional en relation con si llueve o no llueve maiiana 
y estamos interesados en la probabilidad conditional de que llovera dada esta informacion. 
Un residente de Florida nos diria que la probabilidad condicional de lluvia (dado que ha llo¬ 
vido dos dfas antes y que se ha pronosticado una tormenta tropical) es mucho mayor que una 
probabilidad incondicional de lluvia. 

La probabilidad incondicional de un 1 en el tiro de un dado balanceado es 1/6. Si sabemos 
que ha caido un numero impar, el numero del dado debe ser 1, 3 o 5 y la frecuencia relativa de que 
haya un 1 es 1/3. La probabilidad condicional de un evento es la probabilidad (frecuencia 
relativa de ocurrencia) del evento dado el hecho de que uno o mas eventos ya han ocurrido. 
Un examen cuidadoso de este ejemplo indicara el acuerdo de la siguiente definicion con el 
concepto de probabilidad de frecuencia relativa. 


DEFINICION 2.9 


La probabilidad conditional de un evento A, dado que un evento B ha ocurrido, es 
igual a 


P(A\B) 


P(A DB) 
P(B ) 


siempre que P(B ) > 0. [El shnbolo P(A\B) se lee “probabilidad de A dada //”.] 


Una confirmation adicional de la consistencia de la Definicion 2.9 con el concepto de 
probabilidad de frecuencia relativa se puede obtener de la siguiente construction. Suponga 
que un experimento se repite un gran numero de veces, N, resulta en A y B, A U B, n n veces; 
A y no B, ADB, n 2l veces; B y no A, A OB, n 12 veces; y ni A ni B, A D B, n 2 2 , veces. Estos 
resultados estan contenidos en la Tabla 2.1. 

Notese que n u + n n + h 21 + n 22 = N. Entonces se deduce que 


P(A) = 
P(B\A) 


n it + «21 


N 


P(B) 


n ii + »i 2 
N 


P(A\B), 


n n 


n ii + «i 2 


nn 


nn + «21 


Hu 

y P(A DB) « —, 
J N 


donde ~ se lee aproximadamente igual a. 
Con estas probabilidades, es facil ver que 


P(B\A) 


P(AHB) 

P{A) 


y p(A\b) 


P(A HB) 
P(B ) 


Por tanto, la Definicion 2.9 es consistente con el concepto de probabilidad de frecuencia re¬ 
lativa. 


Tabla 2.1 Tabla para eventos Ay B 



A 

A 


B 

n a 

H12 

n 11 +n l2 

B 

n 2l 

«22 

n 2 i + n 22 


n 11 +« 2 i 

Hi 2 + n 22 

N 
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EJEMPLO 2.14 

Suponga que un dado balanceado se tira una vez. Use la Definicion 2.9 para hallar la probabi¬ 
lidad de un 1, dado que se obtuvo un numero impar. 

Solucion 

Defina estos eventos: 

A: observarunl. 

B: observar un numero impar. 

Buscamos la probabilidad de A dado que el evento B ha ocurrido. El evento A D B requiere 
que se observen un 1 y un numero impar. En este caso, A C B, de modo que ,4 0/1 = A y 
P(A Pi B) = P(A) = 1/6. Tambien, P(B) = 1/2 y, usando la Definicion 2.9, 

P(ADB) 1/6 1 

1 P(B) 1/2 3 

Notese que este resultado esta en completo acuerdo con nuestra anterior evaluacion intuitiva 
de esta probabilidad. ■ 

DEFINICION 2.10 

Suponga que la probabilidad de que ocurra un evento A no es afectada por que ocurra o no 
ocurra el evento B. Cuando esto sucede, estarfamos inclinados a decir que los eventos Ay B 
son independientes. Esta relacion de eventos esta expresada por la siguiente definicion. 

Se dice que dos eventos Ay B son independientes si se cumple cualquiera de los siguien- 

tes casos: 

P(A|B) = P(A), 

P(B\A) = P(B), 

P(ADB) = P(A)P(B). 

De otro modo, se dice que los eventos son dependientes. 

La nocion de independencia como concepto probabilfstico esta de acuerdo con nuestro 
uso diario de la palabra si cuidadosamente consideramos los eventos en cuestion. Casi todos 
estarfamos de acuerdo en que “fumar” y “contraer cancer de pulmon” no son eventos inde¬ 
pendientes y de modo intuitivo sentirfamos que la probabilidad de contraer cancer de pulmon, 
dado que una persona fuma, es mayor que la probabilidad (incondicional) de contraer cancer 
de pulmon. En contraste, los eventos “llovera hoy” y “llovera dentro de un mes” muy bien 
pueden ser independientes. 

EJEMPLO 2.15 

Considere los siguientes eventos en el tiro de un solo dado: 

A: observar un numero impar. 

B: observar un numero par. 

C: observar un 1 o 2. 
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a lAy B son eventos independientes? 
b iA y C son eventos independientes? 

Solucion a Para decidir si A y B son independientes, debemos ver si satisfacen las condiciones de 
la Definicion 2.10. En este ejemplo, P{A ) = 1/2, P(B) = 1/2 y P(C ) = 1/3. Como A Cl 
5 = 0, 5(A|5) = 0 y es evidente que P{A\B) ¥= 5(A). Los eventos Ay B son dependien- 

tes. 

b iA y C son independientes? Observe que P(A\C) = 1/2 y, como antes, 5(A) = 1/2. Por 
tanto, P(A\C) = 5(A) y Ay C son independientes. ■ 


EJ EMPLO 2.16 Tres marcas de cafe, X, Y y Z, van a ser clasificadas por un juez de acuerdo con su sabor. 
Defina los siguientes eventos: 

A: la marca X es preferida a la Y. 

B: la marca X es clasificada como la mejor. 

C: la marca X es clasificada como la segunda mejor. 

D: la marca X es clasificada como la tercera mejor. 

Si el juez en realidad no tiene preferencia por el sabor y al azar asigna lugar a las marcas, 
,' cl evento A es independiente de los eventos B, C y D1 

Solucion Los seis puntos muestrales igualmente probables para este experimento estan dados por 

Ei: XYZ, Ei: YXZ, E 5 : ZXY, 

Ei: XZY, E 4 : YZX, E 6 : ZYX, 


donde XYZ denota que X es clasificada como la mejor, Y es la segunda mejor y Z al ultimo. 

Entonces A = {£j, E 2 , £ 5 }, B = {£ 1 , £ 2 }, C = {£ 3 , £ 5 }, D = {£ 4 , E&} y se deduce 
que 

, , P(ADB) 

P(A) = 1/2, P(A\B) = V p(g) = 1, P(A|C) = 1/2, P(A\D) = 0. 

Asf, los eventos Ay C son independientes, pero los eventos Ay B son dependientes. Los 
eventos Ay D tambien son dependientes. ■ 


Ejercicios 

2.71 Si dos eventos, Ay B, son tales que P(A) = .5, P{B) = .3, y P(A flfi) = .1, encuentre lo siguiente: 

a P(A\B) 
b P(B\A) 
c P(A|AU5) 






Ejercicios 55 


d P(A\Ar\B) 
e P(AnB|AUB) 

2.72 Para cierta poblacion de empleados, el porcentaje que aprueba o reprueba un examen de competencia en 
un trabajo, indicado de acuerdo con el genero, fueron como se ve en la tabla siguiente. Esto es, de todas 
las personas que tomaron el examen, 24% estaban en la categorfa de hombre-aprobado, 16% estuvieron 
en la categorfa de mujer-reprobada y asf sucesivamente. Un empleado va a ser seleccionado al azar de 
esta poblacion. Sea A el evento de que el empleado obtenga una calificacion de aprobado en el examen 
y sea M el evento de que se seleccione un hombre. 


Genero 


Resultado 

Masculino (M) 

Femenino ( F) 

Total 

Aprobado (A) 

24 

36 

60 

Reprobado (A) 

16 

24 

40 

Total 

40 

60 

100 


a ^Los eventos Ay M son independientes? 
b ^Los eventos Ay F son independientes? 

2.73 Gregor Mendel fue un monje que, en 1865, sugirio una teorfa de la herencia basada en la ciencia de la 
genetica. El identified individuos heterocigotos para color de flor que tenfan dos alelos (un r = alelo 
color bianco recesivo y un R = alelo color rojo dominante). Cuando estos individuos se apareaban, se 
observaba que 3/4 de la descendencia tenfan flores rojas y 1/4 tenfan flores blancas. La tabla siguiente 
resume este apareamiento; cada padre da uno de sus alelos para formar el gen de la descendencia. 


Padre 2 


Padre 1 r R 


r rr rR 

R Rr RR 


Suponemos que es igualmente probable que cada padre contribuye con cualquiera de los dos alelos y 
que, si uno o dos de los alelos en un par es dominante (R), la descendencia tendra flores rojas. ^,Cual es 
la probabilidad de que un descendiente tenga 
a al menos un alelo dominante?, 
b al menos un alelo recesivo?, 

c un alelo recesivo, dado que la descendencia tiene flores rojas? 

2.74 Cien adultos fueron entrevistados en una encuesta por telefono. De interes fue la opinion de ellos con 
respecto a las cargas que implican los prestamos para estudiantes universitarios y si quienes respondie- 
ron tenfan un hijo actualmente en la universidad. Sus respuestas se resumen en la tabla siguiente: 


Hijo en la 
universidad 


Carga de prestamo 

Total 

Demasiado alta(A) 

Razonable (B) 

Demasiado baja (C) 

Sf (D) 

.20 

.09 

.01 

.30 

No (£) 

.41 

.21 

.08 

.70 

Total 

.61 

.30 

.09 

1.00 
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De los siguientes eventos, ^cuales son independientes? 
a Ay D 
b By D 
c Cy D 

2.75 Se reparten cartas, una a la vez, de una baraja de 52 cartas. 

a Si las primeras 2 cartas son espadas, ^cual es la probabilidad de que las siguientes 3 cartas tambien 
sean espadas? 

b Si las primeras 3 cartas son todas de espadas, ^,cual es la probabilidad de que las 2 cartas siguientes 
sean tambien espadas? 

c Si las primeras 4 cartas son todas de espadas, ^,cual es la probabilidad de que la siguiente carta sea 
tambien una espada? 

2.76 Una encuesta de consumidores en una comunidad particular mostro que 10% no estaban satisfechos con 
los trabajos de plomerfa realizados en sus casas. La mitad de las quejas se referfa al plomero A, que rea- 
liza 40% de los trabajos de plomerfa de la poblacion. Encuentre la probabilidad de que un consumidor 
obtenga 

a un trabajo de plomerfa no satisfactorio, dado que el plomero era A. 
b un trabajo de plomerfa satisfactorio, dado que el plomero era A. 

2.77 Un estudio de conducta, despues de un tratamiento hecho a gran numero adictos a las drogas, sugiere 
que la probabilidad de hallarlos culpables no mas de dos anos despues del tratamiento depende de la 
education de los infractores. Las proporciones del numero total de casos que caen en cuatro categories 
de educacion-culpabilidad se muestran en la tabla siguiente: 


Situation en no mas de 2 anos 
despues de tratamiento 


Education 

Culpable 

No culpable 

Total 

10 anos o mas 

.10 

.30 

.40 

9 anos o menos 

.27 

.33 

.60 

Total 

.37 

.63 

1.00 


Suponga que se selecciona un solo infractor del programa de tratamiento. Defina los eventos: 

A: el infractor tiene 10 o mas anos de education. 

B: el infractor es hallado culpable en no mas de dos anos despues de terminar el tratamiento. 
Encuentre lo siguiente: 

a P(A). 
b P{B). 

c p(a ns), 
d P(A U B). 
e P(A). 
f P(A US), 
g P(A~nB). 
h P{A\B). 
i P{B\A). 

2.78 En la definition de la independencia de dos eventos, nos dan tres igualdades para comprobarlas: 
P(A\B ) = P(A)oP(B\A) — P(B) o P(AnB) — P(A)P(B). Si una cualquiera de estas igualdades se 








2.8 Dos leyes de probabilidad 57 


cumple. Ay B son independientes. Demuestre que si cualquiera de estas igualdades se cumple, las otras 
dos tambien se cumplen. 

2.79 Suponga que Ay B son eventos mutuamente excluyentes, con P(A ) > 0 y P(B) < 1. ^A y B son indepen¬ 
dientes? Justifique su respuesta. 

2.80 Suponga que A C B y que Pi A) > 0 y P(B) > 0. iA y B son independientes? Justifique su respuesta. 

2.81 Si P(A) > 0, P(B) > 0 y P(A) < P(A \ B), demuestre que P(B) < P(B\A). 

2.82 Suponga que A C B y que P(A) > 0 y P(B) > 0. Demuestre que P(B \ A) — 1 y P(A\B) = P(A)/P(B). 

2.83 Si A y B son eventos mutuamente excluyentes y P(B) > 0, demuestre que 


P(A\A US) 


P{A) 

P(A) + P(B) 


2.8 Dos leyes de probabilidad 

Las dos leyes siguientes proporcionan las probabilidades de uniones e intersecciones de even¬ 
tos. Como tales, desempenan un importante papel en el metodo de composicion de evento 
para la solucion de problemas de probabilidad. 

TEOREMA 2.5 


Demostracion 


Ley multiplicativa de probabilidad La probabilidad de la interseccion de dos eventos 
A y B es 

P{A DB) = P(A)P(B\A) 

= P(B)P(A\B). 

Si A y B son independientes, entonces 

P{A D B) = P(A)P(B). 

La ley multiplicativa se deduce directamente de la Definicion 2.9, la definicion de pro¬ 
babilidad condicional. 


Observe que la ley multiplicativa se puede extender para hallar la probabilidad de la intersec¬ 
cion de cualquier numero de eventos. Entonces, aplicando dos veces el Teorema 2.5, obtene- 
mos 


P(A DB DC) = P[(A DB) PC] = P(A DB)P(C\A DB) 

= P(A)P(B\A)P(C\A DB). 

La probabilidad de la interseccion de cualquier numero de k eventos, por ejemplo, se puede 
obtener en la misma forma: 

P{A X HA 2 OA 3 n • ■ • OA*) = /•(A 1 )P(A 2 |A 1 )P(A 3 |A 1 HA 2 ) 

■■■P(A k \Ai HA 2 Cl • • • OAm). 

La ley aditiva de probabilidad da la probabilidad de la union de dos eventos. 
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TEOREMA 2.6 


Demostracion 


FIGURA 2.10 
Diagrama de Venn 
para la union 
de Ay B 


Ley aditiva de probabilidad La probabilidad de la union de dos eventos A y B es 

P(A U B) = P(A) + P(B) - P(A DB). 

Si A y B son eventos mutuamente excluyentes, P(A D B) = 0 y 

P(A U B) = P(A) + P(B). 

La prueba de la ley aditiva se puede deducir al inspeccionar el diagrama de Venn de la 
Figura 2.10. 

Observe que A U B = AU(Afl B), donde A y (A fl B) son eventos mutuamente 
excluyentes. Ademas, B = (A Cl fi) U (A DB), donde (A fl B) y (A fl B) son eventos 
mutuamente excluyentes. Entonces, por el Axioma 3, 

P(AUB) = P(A) + P(ADB) y P(B) = P(A fl B) + P(A 0 B). 

LaigualdaddadaaladerechaimplicaqueP(A fl B) = P(B) — P{A 0 B). Sustituyendo 
esta expresion por P( A fl B) en la expresion para P(A U B) dada en la ecuacion del lado 
izquierdo del par anterior, obtenemos el resultado deseado: 

P(A U B) = P(A) + P(B) - P(A DB). 

La probabilidad de la union de tres eventos se puede obtener al hacer uso del Teorema 2.6. 
Observe que 

P(A U B UC) = P[A U (B UC)] 

= P{A) + P(B UC) - P[A (~\{B UC)] 

= P(A) + P(B) + P(C ) - P(B ClC) - P[(A OB)U(A OC)] 

= P(A) + P(B) + P(C) - P(B DC) - P(A DB) - P(A DC) 

+ P(ADB DC) 

porque (A Cl B) Cl (A Cl Q = A Cl B Cl C. 

Otro resultado util que expresa la relacion entre la probabilidad de un evento y su comple- 
mento se encuentra de inmediato disponible en los axiomas de probabilidad. 



A 


B 
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TEOREMA 2.7 

Demostracion 

Como veremos en la Seccion 2.9, en ocasiones es mas facil calcular P(A) que calcular 
P(A). En tales casos, es mas sencillo hallar P(A) por la relacion P( A) = 1 — P( A) que encon- 
trar P(A) directamente. 

Ejercicios 

2.84 SiAj, A 2 y A 3 son tres eventos y P(Ai flA 2 ) = P(A[ HA 3 ) + pero P(A 2 nA 3 ) = 0, demuestre que 

P(al menos unaA,) = PfAA + P(A 2 ) + P(A 3 ) - 2 P(A, n A 2 ). 

2.85 Si A y B son eventos independientes, demuestre que Ay B son tambien independientes. lA y B son 
independientes? 

2.86 Suponga que A y B son dos eventos tales que P(A) = .8 y P(B) = .7. 
a ^Es posible que P(A fl B) = .1? ^Por que sf o por que no? 

b ^Cual es el valor mas pequeno posible de P(A D 5)? 
c ^Es posible que P(A fl B) = .77? i,Por que sf o por que no? 
d ^Cual es el maximo valor posible para P(A D 6)? 

2.87 Suponga que Ay B son dos eventos tales que P(A) + P(B) > 1. 
a ^Cual es el mfnimo valor posible para P(A n B)1 

b ^Cual es el maximo valor posible para P(A n 6)? 

2.88 Suponga que A y B son dos eventos tales que P(A) = .6 y P(B) = .3. 
a ^,Es posible que P{A fl B)— .1? ^.Por que sf o por que no? 

b ^Cual es el mfnimo valor posible para P(A D fi)? 
c ^,Es posible que P{A fl B)= .7? ^.Por que sf o por que no? 
d ^Cual es el maximo valor posible para P(A D B)? 

2.89 Suponga que Ay B son dos eventos tales que P(A) + P(B) < 1. 
a ^Cual es el mfnimo valor posible para P(A n B)1 

b ^Cual es el maximo valor posible para P(A H B)2 

2.90 Suponga que hay 1 en 50 probabilidades de lesion en un solo intento de paracaidismo. 

a Si suponemos que los resultados de diferentes saltos son independientes, ^cual es la probabilidad de 
que una paracaidista se lesione si salta dos veces? 

b Un amigo dice que si hay 1 en 50 probabilidades de lesion en un solo salto entonces hay un 100% de 
probabilidad de lesion si una paracaidista salta 50 veces. ^Tiene razon su amigo? ^Por que? 


Si A es un evento, entonces 

P(A) = 1 - P(A). 

Observe que S = A U A. Como A y A son eventos mutuamente excluyentes, se deduce 
queP(5') = P(A) + P(A). Por tanto, P(A) + P(A) = 1 y el resultado sigue. 
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2.91 ^Pueden A y B ser mutuamente excluyentes si P{A) = .4 y P(B) = .7? ^Si P{A) = .4 y P(B) = .3? ^Por 
que? 

2.92 Una polftica que requiere que todos los empleados hospitalarios hagan examenes de detector de men- 
tiras reduce perdidas debidas a robos, pero algunos empleados consideran tales examenes como una 
violation a sus derechos. Experiencias pasadas indican que los detectores de mentiras tienen porcentajes 
de precision que varfan de 92% a 99%. 2 Para tener alguna idea de los riesgos a los que se enfrentan los 
empleados cuando hacen un examen de detector de mentiras, suponga que la probabilidad es .05 de que 
un detector de mentiras concluya que una persona esta mintiendo y que, en realidad, este diciendo la 
verdad, y suponga que cualquier par de examenes son independientes. ^Cual es la probabilidad de que 
una maquina concluya que 

a cada uno de tres empleados esta mintiendo cuando todos estan diciendo la verdad?, 
b al menos uno de los tres empleados esta mintiendo cuando todos estan diciendo la verdad? 

2.93 En un juego de softball, una jugadora tiene tres oportunidades para conectar un imparable. En cada 
intento, ella conecta un hit, H , o no conecta, M. El juego requiere que la jugadora debe altemar la mano 
que usa en intentos sucesivos, es decir, si ella hace su primer intento con la mano derecha, debe usar 
la izquierda para el segundo intento y su mano derecha para el tercero. Su oportunidad de conectar un 
hit con la derecha es .7 y con la izquierda es .4. Suponga que los resultados de intentos sucesivos son 
independientes y que ella gana el juego si conecta al menos dos hits consecutivos. Si ella hace su primer 
intento con la mano derecha, ^cual es la probabilidad de que gane el juego? 

2.94 Un sistema detector de hurno utiliza dos dispositivos, A y B. Si hay humo, la probabilidad que sea detec- 
tado por el dispositivo A es .95; por el dispositivo B, .90; y por ambos dispositivos, .88. 

a Si hay humo, encuentre la probabilidad de que el humo sea detectado ya sea por el dispositivo A o el 
B o por ambos. 

b Encuentre la probabilidad de que el humo no sea detectado. 

2.95 Dos eventos A y B son tales que P(A) = .2, P(B) = ,3y P(ADB) = .4. Encuentre lo siguiente: 

a P( A CB) 
b P(AUfi) 
c p(a ns) 
d P{A\B) 

2.96 Si A y B son eventos independientes con P(A) = .5 y P(B) = .2, encuentre lo siguiente: 

a P(AUB) 
b P(A (~l B) 
c P(AUB) 

2.97 Considere la portion siguiente de un circuito electrico con tres relevadores. Circulara corriente del punto 
a al b si hay al menos un circuito cerrado cuando los relevadores estan activados. Los relevadores fun- 
cionan mal y no cierran cuando se activan. Suponga que los relevadores actuan de manera independiente 
entre si y cierran en forma apropiada cuando son activados con una probabilidad de .9. 

a ^Cual es la probabilidad de que circule corriente cuando los relevadores se activan? 

b Dado que circulo corriente cuando se activaron los relevadores, ^cual es la probabilidad de que el 
relevador 1 funcione? 


2. Fuente: Copyright © 1980 Sentinel Communications Co. Todos los derechos reservados. 


Ejercicios 61 



2.98 Con relevadores operando como en el Ejercicio 2.97 compare la probabilidad de que circule corriente de 
a a b en el sistema en serie que se muestra 


A 


o 


<D 


con la probabilidad de circulation en el sistema en paralelo que se muestra. 



2.99 Suponga que Ay B son eventos independientes tales que la probabilidad de que ninguno suceda es a y 

1 — b — a 

la probabilidad de B es b. Demuestre que P(A) = _ . 

*2.100 Demuestre que el Teorema 2.6, la ley aditiva de probabilidad, se cumple para probabilidades condicio- 
nales. Esto es, si A, B y C son eventos tales que P(C) > 0, demuestre que P(A UB|C) = P(A\C) + 
■P(B\C)-P(AnB\C). [Sugerencia: haga uso de la ley distributiva (AUB)nC = (AnC)U(SnC).] 

2.101 Los artfculos que pasan por una lrnea de inspeccion son revisados visualmente por dos inspectores 
sucesivos. Cuando un artfculo defectuoso pasa por la lrnea de inspeccion, la probabilidad de que sea 
captado por el primer inspector es .1. El segundo inspector “no ve” cinco de entre diez de los artfculos 
defectuosos que deja pasar el primer inspector. ^,Cual es la probabilidad de que un artfculo defectuoso 
no sea captado por ambos inspectores? 

2.102 Las enfermedades I y II son prevalecientes entre las personas de cierta poblacion. Se supone que 10% 
de la poblacion contraera la enfermedad I alguna vez en su vida, 15% contraera la enfermedad II con el 
tiempo y 3% contraera ambas enfermedades. 

a Encuentre la probabilidad de que una persona escogida al azar de esta poblacion contraiga al menos 
una enfermedad. 

b Encuentre la probabilidad condicional de que una persona escogida al azar de esta poblacion contrai¬ 
ga ambas enfermedades, dado que el o ella ha contrafdo al menos una enfermedad. 

2.103 Consulte el Ejercicio 2.50. Horas despues de que fuera anunciada la manipulacion de la loterfa del esta- 
do de Pennsylvania, los oficiales de la loterfa del estado de Connecticut quedaron sorprendidos al ente- 
rarse que su numero ganador para el dfa fue el 666 {Los Angeles Times, 21 de septiembre de 1980). 

a Toda la evidencia indica que la selection del 666 de Connecticut fue pura casualidad. ^.Cual es la 
probabilidad de que un 666 saiga en Connecticut, dado que un 666 habfa sido seleccionado el 24 de 
abril de 1980 en la loterfa de Pennsylvania? 


b ^Cual es la probabilidad de sacar un 666 en la loterfa de Pennsylvania el 24 de abril de 1980 (re- 
cuerde, este resultado fue una manipulacion) y un 666 el 19 de septiembre de 1980 en la loterfa de 
Connecticut? 
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2.104 Si A y B son dos eventos, demuestre que P(A(1B) > 1 — P( A) — P(B). [Nota: esta es una version sim- 
plificada de la desigualdad de Bonferroni.] 

2.105 Si la probabilidad de lesiones en cada salto en paracafdas de un individuo es .05, use el resultado del 
Ejercicio 2.104 para dar un limi te inferior para la probabilidad de un aterrizaje seguro en los dos sal- 
tos. 

2.106 Si A y B son eventos igualmente probables y requerimos que la probabilidad de su intersection sea al 
menos .98, ^cual es P(A)7 

2.107 Sean A, B y C eventos tales que P(A) > P(B) y P( O > 0. Construya un ejemplo para demostrar que es 
posible que P{A\C) < P(B\Q. 

2.108 Si A, B y C son tres eventos, use dos aplicaciones del resultado del Ejercicio 2.104 para demostrar que 
p(A ns nc) > 1 - P(A) ~ P(B) - P(C). 

2.109 Si A, B y C son tres eventos igualmente probables, ^cual es el rmnimo valor para P{A) tal que P(A n B 
n Cj siempre sea mayor que 0.95? 


2.9 Calculo de la probabilidad de un evento: 
el metodo de composicion de evento 

Aprendimos en la Seccion 2.4 que los conjuntos (eventos) se pueden expresar en ocasiones como 
uniones, intersecciones o complementos de otros conjuntos. El metodo de composicion de 
evento para calcular la probabilidad de un evento. A, lo expresa como una composicion que 
comprende uniones y/o intersecciones de otros eventos. Las leyes de probabilidad se aplican 
entonces para hallar P(A). Ilustraremos este metodo con un ejemplo. 


EJEMPLO 2.17 De los votantes en una ciudad, 40% son republicanos y 60% son democratas. Entre los re- 
publicanos, 70% estan a favor de una emision de bonos, en tanto que 80% de los democratas 
estan a favor de la emision. Si un votante se selecciona al azar en la ciudad, ^cual es la proba¬ 
bilidad de este a favor de la emision de bonos? 

Solucion Denote con F el evento “a favor de la emision de bonos”, con R el evento “se selecciona un 
republicano” y con D el evento “se selecciona un democrata”. Entonces P(R) = .4, P(D) = .6, 
P(F\R) = .7 y P(F\D) = .8. Notese que 

P(F)= P[(FDR)U(FDD)\= P(FDR)+ P(F D D) 

porque (F Pi R) y (F Pi D) son eventos mutuamente excluyentes. La Figura 2.11 ayudara a 
visualizar el resultado de que F = [F DR) U [FDD). Ahora 

P(FDR) = P(F\R)P(R) = (,7)(,4) = .28, 

P(FDD) = P{F\D)P{D) = (.8)(.6) = .48. 


Se deduce que 


P(F) = .28 + .48 = .76. 
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FIGURA 2.11 s 



EJEMPLO 2.18 En el Ejemplo 2.7 consideramos un experimento en el que se registraron los cumpleanos de 
20 personas seleccionadas al azar. En ciertas condiciones encontramos que P(A) = .5886, 
donde A denota el evento de que cada persona tenga un cumpleanos diferente. Denote con B 
el evento de que al menos un par de personas comparta cumpleanos. Encuentre P(B). 


Solucion El evento B es el conjunto de todos los puntos muestrales en S que no estan en A, es decir, 
B = A.Portanto, 

P(B) = 1 - P(A) = 1 - .5886 = .4114. 

(Casi todos estan'amos de acuerdo en que esta probabilidad es sorprendentemente alta.) ■ 


Consultemos el Ejemplo 2.4, que involucra los dos jugadores de tenis y denotemos con D x 
y D 2 los eventos de que el jugador A gane el primero y segundo juegos, respectivamente. La 
information dada en el ejemplo implica que P(D ,) = P(D 2 ) = 2/3. Ademas, si hacemos la su- 
posicion de que I) t y I) 2 son independientes, se deduce que P ( D\ fl D 2 ) = 2/3 X 2/3 = 4/9. 
En ese ejemplo identificamos el evento simple Ej, que denotamos como AA queriendo decir 
que el jugador A gano ambos juegos. Con la notation presente, 

Ei = D\ no 2 , 

y por tanto /*(£/) = 4/9. Las probabilidades asignadas a los otros eventos simples del Ejemplo 
2.4 se pueden verificar de un modo similar. 

El metodo de composicion de evento no tendra exito a menos que se conozcan las proba¬ 
bilidades de los eventos que aparecen en P(A) (despues de aplicar las leyes aditiva y multipli- 
cativa). Si no se conoce una o mas de estas probabilidades, el metodo falla. En ocasiones es 
deseable formar composiciones de eventos mutuamente excluyentes o independientes; estos 
simplifican el uso de la ley aditiva, y la ley multiplicativa de probabilidad es mas facil de apli¬ 
car a eventos independientes. 
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A continuation veamos un resumen de los pasos seguidos en el metodo de composition 
de evento: 

1. Definir el experimento. 

2. Visualizar la naturaleza de los puntos muestrales. Identificar unos pocos para 
aclarar el modo de pensar del experto en estadfstica. 

3. Escribir una ecuacion que exprese el evento de interes, A por ejemplo, como una 
composition de dos o mas eventos, usando uniones, intersecciones y/o comple- 
mentos. (Notese que esto iguala conjuntos de puntos.) Asegurarse que el evento 
A y el evento implicado por la composition representan el mismo conjunto de 
puntos muestrales. 

4. Aplicar las leyes aditiva y multiplicativa de probabilidad a las composiciones ob- 
tenidas en el paso 3 para hallar P(A). 


El paso 3 es el mas dificil porque podemos formar muchas composiciones que seran equi- 
valentes al evento A. El truco es formar una composition en la que se conozcan todas las 
probabilidades que aparezcan en el paso 4. 

El metodo de composition de evento no requiere indicar los puntos muestrales en .S', pero 
requiere un claro entendimiento de la naturaleza de un punto muestral tfpico. El principal error 
que los estudiantes cometen al aplicar el metodo de composition de evento es cuando escriben 
la composition. Esto es, la ecuacion del conjunto de puntos que expresa A como la union y/o 
intersection de otros eventos es, con frecuencia, incorrecta. Siempre compruebe su igualdad y 
asegurese de que la composition implica un evento que contenga el mismo conjunto de puntos 
muestrales que en A. 

Una comparacion de los metodos de punto muestral y de composition de evento para 
calcular la probabilidad de un evento se puede obtener al aplicar ambos metodos al mismo 
problema. Aplicaremos el metodo de composition de evento al problema de seleccionar soli- 
citantes que fue resuelto por el metodo de punto muestral en los Ejemplos 2.11 y 2.12. 


EJ EMPLO 2.19 Dos solicitantes se seleccionan al azar de entre cinco que han solicitado un trabajo. Encuentre 
la probabilidad de que se seleccione exactamente uno de los dos mejores, evento A. 

Solution Defina los siguientes dos eventos: 

B: Sacar al mejor y a uno de los tres solicitantes mas malos. 

C: Sacar al segundo mejor y a uno de los tres solicitantes mas malos. 

Los eventos By C son mutuamente excluyentes y A = B U C. Tambien, sea D x = B t D B 2 , 
donde 

B j = Sacar al mejor en la primera oportunidad, 

B 2 = Sacar uno de los tres solicitantes mas malos en el segundo intento, 
y D 2 = B 3 Pi B 4 , donde 

B 2 = Sacar uno de los tres solicitantes mas malos en el primer intento, 

B 4 = Sacar al mejor en el segundo intento. 

Observe que B = D x U D 2 . 
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Del mismo modo, sea G x = C x Pi C 2 y G 2 = C 3 fl C 4 , donde C' h C 2 , C 3 y C 4 estan definidas 
como B v B 2 , B 3 y P 4 , con las palabras segundo mejor sustituyendo a mejor. Notese que D x y 
D 2 y Gy y G 2 son pares de eventos mutuamente excluyentes y que 

A = B U C = (Di U D 2 ) U (Gi U G 2 ), 

a = (z?i n b 2 ) u (b 3 n p 4 ) u (Ci n c 2 ) u (C 3 n c 4 ). 

Si aplicamos la ley aditiva de la probabilidad a estos cuatro eventos mutuamente excluyen¬ 
tes tenemos 


p(A) = p(By n b 2 ) + p(b 2 n b 4 ) + P(c i n c 2 ) + p(C 3 n c 4 ). 

A1 aplicar la ley multiplicativa tenemos 

P(ByHB 2 ) = P(By)P{B 2 \By). 

La probabilidad de sacar al mejor en el primer intento es 

P(By) = 1/5. 

Del mismo modo, la probabilidad de sacar uno de los tres mas malos en el segundo intento, 
dado que el mejor fue sacado en la primera seleccion, es 


P(B 2 \B\) = 3/4. 

Entonces 


P(5! n B 2 ) = P{B X )P(B,\B X ) = (1/5X3/4) = 3/20. 

Las probabilidades de todas las otras intersecciones en P(A), P( Bx Pi /i 4 ), P(CinC 2 ) y 
P(C 3 fl C 4 ) se obtienen exactamente del mismo modo y todas son iguales a 3/20. Entonces 

P( A) = p(Bi n b 2 ) + p(b 3 n b 4 ) + P(Ci n c 2 ) + P(C 3 n c 4 ) 

= (3/20) + (3/20) + (3/20) + (3/20) = 3/5. 

Esta respuesta es identica a la obtenida en el Ejemplo 2.12, donde P(A) se calculo usando 
el metodo de punto muestral. ■ 


EJ EMPLO 2.20 Se sabe que un paciente con una enfermedad respondera al tratamiento con probabilidad igual 
a .9. Si tres pacientes con la enfermedad son tratados y responden de manera independiente, 
encuentre la probabilidad de que al menos uno responda. 

Solucion Defina los siguientes eventos: 

A: Al menos uno de los tres pacientes respondera, 

By. El primer paciente no respondera. 

B 2 : El segundo paciente no respondera. 

B 3 : El tercer paciente no respondera. 
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Entonces observe que A = B\ n B 2 Pi B 3 . El teorema 2.7 implica que 

P(A) = 1 - P(A) 

= i - p(Bi n b 2 n b 3 ). 

Aplicando la ley multiplicativa tenemos 

P(Bi hb 2 ns 3 ) = P(B 1 )P(B 2 \B 1 )P(B 3 \B 1 hb 2 ), 
donde, debido a que los eventos son independientes, 

P(B 1 \B l ) = P(B 2 ) = 0.1 y P(5 3 |fi, DB 2 ) = P(B 3 ) = 0.1. 

Sustituyendo P(B ; ) = .1, i = 1, 2, 3, obtenemos 

P(A) = 1 — (. I) 3 = .999. 

Observe que hemos demostrado la utilidad de eventos complementarios. Este resultado es 
importante porque con frecuencia es mas facil hallar la probabilidad del complemento, P(A), 
que hallar P(A) directamente. ■ 


EJ EMPLO 2.21 La observation de una fila de espera en una clmica medica indica que la probabilidad de que una 
nueva llegada sea un caso de emergencia es p = 1/6. Encuentre la probabilidad de que el r- 
esimo paciente sea el primer caso de emergencia. (Suponga que las condiciones en que llegan 
los pacientes representan eventos independientes.) 

Solution El experimento consiste en observar las llegadas de pacientes hasta que aparezca el primer 
caso de emergencia. Entonces los puntos muestrales para el experimento son 

Ef. El /-esimo paciente es el primer caso de emergencia, para i = 1,2 ,. 

Como solo un punto muestral cae en el evento de interes, 

Efr-esimo paciente es el primer caso de emergencia) = P(E r ). 

Ahora defina A t para denotar el evento de que la i-esima llegada no sea un caso de emer¬ 
gencia. Entonces podemos representar £ r como la intersection 

E r — A\ n A 2 n a 3 n ha,— i n A r . 

Aplicando la ley multiplicativa tenemos 

P(E r ) = />(a 1 )p(a 2 |a 1 )p(a 3 |a 1 n a 2 ) ■ ■ -p(a,.\a { n • • • n A r _o, 

y como los eventos A v A 2 , ..., A r , y A r son independientes, se deduce que 

P(E r ) = P(A\)P(A 2 ) ■ ■ ■ P{A r -\)P{A r ) = (1 - py~ x p 
= (5/6) r “'(l/6), r = 1,2,3,.... 
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Observe que 

P(S) = 


Este resultado se obtiene de la formula para la suma de una serie geometrica dada en el 
Apendice A 1.11. Esta formula, que expresaque si j r\ < 1, J2h=o r ‘ = pry, es util en muchos 
problemas simples de probabilidad. ■ 


P(Pi) + P(E 2 ) + P(E 3 ) + ■ ■ ■ + P(Ej)+ ■ ■ ■ 

(1/6) + (5/6)(l/6) + (5/6) 2 (l/6) + ■ ■ • +(5/6) / ' 1 (l/6) + 

<s h W 1 - <5/6) 


EJ EMPLO 2.22 Una mona ha de demostrar que reconoce los colores al lanzar al aire una bola roja, una negra 
y una blanca en cajas de los mismos colores respectivamente, una bola por caja. Si la mona 
no ha aprendido los colores y simplemente lanza una bola en una caja al azar, encuentre las 
probabilidades de los siguientes resultados: 

a No hay coincidencia de colores, 
b Hay exactamente una coincidencia de colores. 

Solucion Este problema se puede resolver si se hace una lista de puntos muestrales porque solo hay tres 
pelotas, pero se ilustrara un metodo mas general. Defina los eventos siguientes: 

A{. Hay una coincidencia de colores en la caja roja. 

A 2 : Hay una coincidencia de colores en la caja negra. 

A 3 : Hay una coincidencia de colores en la caja blanca. 

Hay 3! = 6 formas igualmente probables de lanzar pelotas al azar en las cajas con una pelota 
en cada caja. Tambien, hay solo 2! = 2 formas de lanzar las pelotas en las cajas si se requiere 
que una caja en particular contenga una coincidencia de color. Por tanto, 

P(Ai) = P(A 2 ) = P(A 3 ) = 2/6 = 1/3. 

Del mismo modo, se deduce que 

P{A\ HA 2 ) = P{A\ HA 3 ) = P(A 2 HA 3 ) = P(A l DA 2 fl A 3 ) = 1/6. 

Podemos ahora contestar los incisos a y b usando el metodo de composicion de eventos. 
a Observe que 

P (no hay coincidencia de colores) = 1 — P (al menos una coincidencia de colores) 

= 1 -P(Aj UA 2 UA 3 ) 

= 1 - [P(AO + P(A 2 ) + p(A 3 ) - P(Aj n a 2 ) 

- P(A! n A 3 ) - P(A 2 oa 3 ) + P(Ai n a 2 da 3 )] 
= 1 - [3(1/3) - 3(1/6) + (1/6)] = 2/6 = 1/3. 
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b El estudiante debe demostrar que 

P (exactamente una pareja) = P(A\) + P(A 2 ) + P(A 2 ) 

-2[P(A l ha 2 ) + P(A, ha 3 ) + P(A 2 nAj)] 

+ 3[P(A, ha 2 nA 3 )] 

= (3)( 1/3) - (2)(3)( 1/6) + (3)( 1/6) = 1/2. ■ 


La mejor forma de aprender a resolver problemas de probabilidad es haciendolos. Para 
ayudar al estudiante a desarrollar experiencia, al final de esta section, de este capftulo y de la 
bibliograffa se presentan muchos ejercicios. 


Ejercicios 

2.110 De los artfculos producidos diariamente por una fabrica, 40% provienen de la lrnea I y 60% de la lfnea 
II. La lrnea I dene un porcentaje de 8% de piezas defectuosas en tanto que la II tiene un porcentaje de 
10%. Si se escoge al azar una pieza de la production diaria, encuentre la probabilidad de que no este 
defectuosa. 

2.111 Una agencia de publicidad observa que aproximadamente 1 de cada 50 compradores potenciales de un 
producto ve el anuncio en una revista determinada y 1 de cada 5 ve un anuncio correspondiente en tele¬ 
vision. Uno de cada 100 los ve a ambos. Uno de cada 3 en realidad compra el producto despues de ver 
el anuncio y 1 de cada 10 sin verlo. ^Cual es la probabilidad de que un cliente potencial seleccionado al 
azar compre el producto? 

2.112 Tres aparatos de radar, que operan de modo independiente, se ajustan para detectar cualquier avion que 
vuele por cierta zona. Cada aparato tiene una probabilidad de .02 de no detectar un avion en su zona. Si 
un avion entra en esta, ^cual es la probabilidad de que 

a no sea detectado?, 

b sea detectado por los tres aparatos de radar? 

2.113 Considere uno de los radares del Ejercicio 2.112. ^,Cual es la probabilidad de que detecte correctamente 
tres aviones antes de no detectar uno de ellos, si las llegadas de aviones son eventos individuates inde- 
pendientes que suceden en tiempos diferentes? 

2.114 Un detector de mentiras mostrara una lectura positiva (indica una mentira) 10% del tiempo cuando una 
persona esta diciendo la verdad y 95% del tiempo cuando esta mintiendo. Suponga que dos personas son 
sospechosas en un delito cometido por una persona y (de seguro) una es culpable y mentira. Suponga, 
ademas, que el detector de mentiras opera de manera independiente para la persona honesta y para la 
mentirosa. ^Cual es la probabilidad de que el detector 

a muestre una lectura positiva para ambos sospechosos?, 

b muestre una lectura positiva para el sospechoso culpable y una lectura negativa para el sospechoso 
inocente?, 

c este completamente equivocado, es decir, de una lectura positiva para el sospechoso inocente y una 
negativa para el culpable?, 

d de una lectura positiva para cualquiera de los sospechosos o para ambos? 
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Un equipo de futbol tiene una probabilidad de .75 de ganar cuando juegue con cualquiera de los otros 
equipos en su conferencia. Si los juegos son independientes, ^cual es la probabilidad de que el equipo 
gane todos los juegos de su conferencia? 

Una red de comunicaciones tiene un sistema integrado de seguridad contra fallas. En este sistema, si 
falla la linea I, la serial se desvia a la linea II; si tambien falla la linea II, la senal se desvla a la lfnea III. 
La probabilidad de falla de cualquiera de estas tres llneas es .01 y las fallas de estas llneas son eventos 
independientes. ^Cual es la probabilidad de que este sistema de tres llneas no falle por complete? 

Una estacion de inspeccion de autos de un estado tiene dos equipos de inspeccion. El equipo 1 es poco 
severo y pasa todos los automoviles de fabricacion reciente; el equipo 2 rechaza todos los autos en 
una primera inspeccion porque “los faros no estan ajustados correctamente”. Cuatro automovilistas no 
enterados llevan sus autos a la estacion para ser inspeccionados en cuatro dias diferentes y al azar selec- 
cionan uno de los dos equipos. 

a Si los cuatro autos son nuevos y en excelentes condiciones, ^cual es la probabilidad de que tres de 
ellos sean rechazados? 

b /.Cual es la probabilidad de que los cuatro pasen? 

La vlctima de un accidente morira a menos que en los siguientes 10 minutos reciba sangre Rh positiva 
de tipo A, que puede ser donada por una sola persona. El hospital requiere 2 minutos para clasificar el 
tipo de sangre de un donador en perspectiva y 2 minutos para completar la transfusion de sangre. Hay 
numerosos donadores de sangre no clasificada y 40% de ellos tienen sangre Rh positiva tipo A. ^Cual es 
la probabilidad de que la victima del accidente sea salvada si solo hay un equipo para clasificar el tipo 
de sangre? Suponga que el equipo de clasificacion es reutilizable pero puede procesar solo un donador 
a la vez. 

Suponga que dos dados balanceados se lanzan repetidamente y la suma de las dos caras superiores se 
determina en cada tiro. ^Cual es la probabilidad de obtener 

a una suma de 3 antes de obtener una suma de 7?, 
b una suma de 4 antes de obtener una suma de 7? 

Suponga que dos refrigeradores defectuosos se han incluido en un embarque de seis refrigeradores. El 
comprador empieza a probar los seis refrigeradores. uno por uno. 

a ^Cual es la probabilidad de que el ultimo refrigerador defectuoso sea encontrado en la cuarta prue- 
ba? 

b ^Cual es la probabilidad de que no mas de cuatro refrigeradores necesiten ser probados para localizar 
ambos refrigeradores defectuosos? 

c Cuando nos indican que exactamente uno de los dos refrigeradores ha sido localizado en las primeras 
dos pruebas, ^cual es la probabilidad de que el refrigerador defectuoso restante se encuentre en la 
tercera o cuarta pruebas? 

Un nuevo secretario ha recibido n contrasenas de computadora, solo una de las cuales permitira el acce- 
so a un archivo de computadora. Como el secretario no tiene idea de cual contrasena es la correcta, se- 
lecciona una de ellas al azar y la prueba. Si es incorrecta, la desecha y selecciona al azar otra contrasena 
de entre las restantes, prosiguiendo as! hasta que encuentra la correcta. 

a /.Cual es la probabilidad de que el secretario obtenga la contrasena correcta en el primer intento? 

b ^Cual es la probabilidad de que el secretario obtenga la contrasena correcta en el segundo intento? 
lY en el tercero? 

c Un sistema de seguridad se ha iniciado para que si se prueban tres contrasenas incorrectas el archivo 
de computadora queda bloqueado y se niega el acceso. Si n = 7, ^cual es la probabilidad de que el 
secretario tenga acceso al archivo? 
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2.10 Ley de probabilidad total y regia de Bayes 

El metodo de composicion de evento para resolver problemas de probabilidad en ocasiones se 
facilita al ver el espacio muestral, .S', como una union de subconjuntos mutuamente excluyen- 
tes y usar la siguiente ley de probabilidad total. Los resultados de esta seccion estan basados 
en la siguiente construccion. 


DEFINICION 2.11 Para algun entero positivo k, sean los conjuntos B r , B 2 ,... , B k tales que 

1. S = BiUB 2 U-"USt. 

2. Bj fl Bj = 0, para i i= j. 

Entonces se dice que la coleccion de conjuntos [B r , B 2 ,..., B k ) es una particion de S. 


Si A es cualquier subconjunto de S y {/!,, B 2 ,... , B k ] es una particion de S. A puede des- 
componerse como sigue: 

a = (A n#i) u(A db 2 ) u ■ • • u(A ns*)- 
La Figura 2.12 ilustra esta descomposicion para k = 3. 


TEOREMA 2.8 


Demostracion 


Suponga que {B x , B 2 ,..., B k ] es una particion de S (vea la Definicion 2.11) tal que P(Bj) 
> 0, para i = 1,2 ,,k. Entonces, para cualquier evento A 

k 

P(A) = J2 p (A\B i )P(B i ). 

i=i 

Cualquier subconjunto A de S puede escribirse como 

A = AflS = An(BiUB 2 U-" UB k ) 

= (A DBi) U(A DB 2 ) U • • • U (A Cl B k ). 

Observe que, como {B x , B 2 ,..., B k ] es una particion de S, si i ¥= j, 

(A n Bi) D(AD Bj) = AD (B, D Bj) = A Cl 0 = 0 


y que (A Cl B,) y (A Cl B) son eventos mutuamente excluyentes. Entonces, 

P(A) = P(A Cl B\) + P(A DB 2 ) + ■ ■ ■ + P(A DB k ) 

= PiAlB^PiBi) + P(A\B 2 )P{B 2 ) + • ■ • + P(A\B k )P(B k ) 

k 

= Y J p ^ A \Bi)P{B i ). 

i=l 


En los ejemplos y ejercicios que siguen, el lector vera que en ocasiones es mucho mas facil 
calcular las probabilidades condicionales P(A \ /!,) para una B : escogida de manera apropiada 
que calcular P(A) directamente. En tales casos, la ley de probabilidad total puede aplicarse 
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FIGURA 2.12 
Descomposicion del 
even to A 


TEOREMA 2.9 


Demostracion 


EJEMPLO 2.23 


Solucion 


s 



para determinar P(A). Usando el resultado del Teorema 2.8, es una cuestion sencilla deducir 
el resultado conocido como regia de Bayes. 


Regia de Bayes Suponga que {B v B 2 ,..., B k ] es una particion de S (vea la Definicion 
2.11) tal que P{B ,.) > 0, para i = 1,2 ,,k. Entonces 


P(Bj\A) 


P(A\Bj)P(Bj) 


ZP(A\Bi)P(Bi) 


La demostracion se deduce directamente de la definicion de probabilidad condicional y 
la ley de probabilidad total. Observe que 


P(Bj\A) = 


P(ADBj) 

P(A) 


P(A\Bj)P(Bj ) 
£P(A|B,)/>(£,) 

i= 1 


Un fusible electronico es producido por cinco lineas de produccion en una operacion de ma- 
nufactura. Los fusibles son costosos, sumamente confiables y se envian a proveedores en lotes 
de 100 unidades. Como la prueba es destructiva, la mayorfa de los compradores de fusibles 
prueban solo un numero pequeno de ellos antes de decidirse a aceptar o rechazar lotes de fu¬ 
sibles que lleguen. 

Las cinco lmeas de produccion producen fusibles al mismo ritmo y normalmente producen 
solo 2% de fusibles defectuosos, que se dispersan al azar en la produccion. Desafortunadamente, 
la linea 1 de produccion sufrio problemas mecanicos y produjo 5% de piezas defectuosas du¬ 
rante el mes de marzo. Esta situacion llego al conocimiento del fabricante despues de que los fu¬ 
sibles ya habfan sido enviados. Un cliente recibio un lote producido en marzo y probo tres fusibles. 
Uno fallo. / Cual es la probabilidad de que el lote se haya producido en la linea 1 ? ^Cual es la 
probabilidad de que el lote haya provenido de una de las otras cuatro lineas? 

Denotemos con B el evento de que un fusible se saco de la linea 1 y denotemos con A el evento 
de que el fusible estuviera defectuoso. Se deduce entonces directamente que 


P(B) = 0.2 y (A1B) = 3(.05)(.95) 2 = .135375. 
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FIGURA 2.13 
Diagrama de arbol 
para calculos en el 
Ejemplo 2.23. ~A y 
~B son notaciones al- 
ternativas para Ay B, 
respectivamente. 



Del mismo modo, 


P(B) = 0.8 y P{A\B) = 3(.02)(. 98) 2 = .057624. 

Observe que estas probabilidades condicionales fueron muy faciles de calcular. Usando la ley 
de probabilidad total, 


P(A) = P[A\B)P{B) + P(A\B)P{B) 

= (. 135375K. 2) + (. 057624) (. 8) = .0731742. 


Por ultimo, 


P(B\A) 


P(BDA) 

P(A) 


P(A\B)P(B) _ (.135375K.2) 
P(A) 3)731742 


y 


P(fl|A) = 1 - P(B\A) = 1 - .37 = .63. 


La Figura 2.13, obtenida usando la aplicacion Bayes’ Rule as a Tree, ilustra los diversos 
pasos en el calculo de P{B\A). ■ 


Ejercicios 

2.122 Ejercicio de aplicacion Use la aplicacion Bayes ’ Rule as a Tree para obtener los resultados dados en la 
Figura 2.13. 

2.123 Ejercicio de aplicacion Consulte el Ejercicio 2.122 y el Ejemplo 2.23. Suponga que las lfneas 2 a la 5 
siguen iguales, pero la llnea 1 fue parcialmente reparada y produjo un menor porcentaje de defectos. 
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a ^Que impacto tendrfa esto en 5(AI5)? 

b Suponga que P(A I5) disminuyo a . 12 y todas las demas probabilidades siguieron sin cambio. Use la 
aplicacion Bayes ’ Rule as a Tree para reevaluar 5(A 15). 

c ^Como se compara la respuesta que usted obtuvo en el inciso b con la obtenida en el Ejercicio 2.122? 
^Le sorprende este resultado? 

d Suponga que todas las probabilidades siguen iguales excepto 5(A 15). Use la aplicacion de prueba y 
error para hallar el valor de 5(A 15 ) para el cual 5(51 A) = .3000. 

e Si la linea 1 produjo solo articulos defectuosos pero todas las otras probabilidades siguieron sin cam¬ 
bio, ^cual es 5(51 A)? 

f Un amigo esperaba que la respuesta al inciso e fuera 1. Explique por que, dadas las condiciones del 
inciso e. 5(51 A) + 1. 

2.124 Una poblacion de electores contiene 40% de republicanos y 60% de democratas. Se publica que 30% de 
los republicanos y 70% de los democratas estan a favor de un tema de eleccion. Se encuentra que una 
persona seleccionada al azar de esta poblacion esta a favor del tema en cuestion. Encuentre la probabi- 
lidad condicional de que esta persona sea un democrata. 

2.125 Una prueba de diagnostico para una enfermedad es tal que (correctamente) detecta la enfermedad en 
90% de los individuos que en realidad tienen la enfermedad. Tambien, si una persona no tiene la enfer¬ 
medad, la prueba reportara que el o ella no la tiene con probabilidad .9. Solo 1% de la poblacion tiene 
la enfermedad en cuestion. Si una persona es seleccionada al azar de la poblacion y la prueba de diag¬ 
nostico indica que tiene la enfermedad, ^cual es la probabilidad condicional de que tenga, en realidad, 
la enfermedad? ^La respuesta lo sorprende? ^Se considera confiable esta prueba de diagnostico? 

2.126 Ejercicio Applet Consulte el Ejercicio 2.125. La probabilidad de que la prueba detecte la enfermedad 
dado que el paciente tiene la enfermedad se denomina sensibilidad de la prueba. La especificidad de 
la prueba es la probabilidad de que la prueba no indique enfermedad dado que el paciente no tiene en- 
fermedades. El valor de prediccion positivo de la prueba es la probabilidad de que el paciente tenga la 
enfermedad dado que la prueba indica que la enfermedad esta presente. En el Ejercicio 2.125, la enfer¬ 
medad en cuestion era relativamente rara, presentandose con una probabilidad .01 y la prueba descrita 
tiene sensibilidad = especificidad = .90 y valor de prediccion positivo = .0833. 

a En un esfuerzo por aumentar el valor de prediccion positivo de la prueba, la sensibilidad se aumento 
a .95 y la especificidad permanecio en .90, ^cual es el valor de prediccion positivo de la prueba “me- 
jorada”? 

b Todavia no satisfechos con el valor de prediccion positivo del procedimiento, la sensibilidad de la 
prueba se aumento a .999. ^Cual es el valor de prediccion positivo de la prueba modificada (ahora dos 
veces) si la especificidad permanece en .90? 

c Vea con cuidado los diversos numeros que se emplearon para calcular el valor de prediccion positivo 
de las pruebas. (,Por que son tan pequenos todos los valores de prediccion positivos? [ Sugerencia : 
compare el tamano del numerador y el denominador empleados en el quebrado que da el valor del 
valor de prediccion positivo. (,Por que es (relativamente) tan grande el denominador?] 

d La proporcion de individuos con la enfermedad no esta sujeta a nuestro control. Si la sensibilidad de 
la prueba es .90, ^es posible que el valor de prediccion positivo de la prueba se pueda aumentar a un 
valor arriba de .5? ),C6mo? [Sugerencia: considere mejorar la especificidad de la prueba.] 

e Con base en los resultados de sus calculos en las partes previas, si la enfermedad en cuestion es re¬ 
lativamente rara, ^como puede aumentarse significativamente el valor de prediccion positivo de una 
prueba de diagnostico? 

2.127 Ejercicio Applet Consulte los Ejercicios 2.125 y 2.126. Suponga ahora que la enfermedad no es parti- 
cularmente rara y que ocurre con probabilidad .4. 
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a Si, como en el Ejercicio 2.125, una prueba tiene sensibilidad = especificidad = .90, ^cual es el valor 
de prediction positivo de la prueba? 

b ^Por que el valor de prediction positivo de la prueba es mucho mas alto que el valor obtenido en el 
Ejercicio 2.125? [Sugerencia: compare la magnitud del numerador y el denominador empleados en 
la fraction que da el valor del valor de prediction positivo.] 
c Si la especificidad de la prueba permanece en .90, ,4a sensibilidad de la prueba puede ajustarse para 
obtener un valor de prediction positivo arriba de .87? 
d Si la sensibilidad permanece en .90, ^la especificidad puede ajustarse para obtener un valor de pre¬ 
diction positivo arriba de .95? ^Como? 

e Los inventores de una prueba de diagnostico desean que la prueba tenga un alto valor de prediction 
positivo. Con base en los calculos del lector en partes previas de este problema y en el Ejercicio 
2.126, £el valor de la especificidad es mas o menos crftico cuando se desarrolle una prueba para una 
enfermedad mas rara? 

2.128 Use el Teorema 2.8, la ley de probabilidad total, para demostrar lo siguiente: 
a Si P(A\B) = P(A\B), entonces A y B son independientes. 

b Si P(A\C) > P(B\C)y P(A\C) > P(B\C), entonces P(A) > P(B). 

2.129 Se observa que hombres y mujeres reaccionan de modo diferente a un conjunto determinado de circuns- 
tancias; se sabe que 70% de las mujeres reaccionan positivamente a estas circunstancias mientras que 
de este mismo modo reaccionan solo 40% de los hombres. Un grupo de 20 personas, 15 mujeres y 5 
hombres, se sometio a estas circunstancias y a los sujetos se les pidio describieran sus reacciones en un 
cuestionario escrito. Una respuesta escogida al azar de las 20 fue negativa. ^Cual es la probabilidad de 
que haya sido de un hombre? 

2.130 Un estudio de residentes de Georgia sugiere que quienes trabajaron en astilleros durante la Segunda 
Guerra Mundial fueron sometidos a un riesgo considerablemente mas alto de cancer pulmonar (Wall 
Street Journal, 21 de septiembre de 1978). 3 Se encontro que alrededor de 22% de quienes tuvieron 
cancer pulmonar trabaj aron en un tiempo en un astillero. En contraste, solo 14% de quienes no tuvieron can¬ 
cer pulmonar trabajaron en un astillero. Suponga que la proportion de todos los nativos de Georgia que 
vivieron durante la Segunda Guerra Mundial que han contraldo o contraeran cancer pulmonar es .04%. 
Encuentre el porcentaje de georgianos que vivieron durante el mismo periodo que contraeran (o ya han 
contraido) cancer pulmonar, dado que en algun tiempo han trabajado en un astillero. 

2.131 La diferencia simetrica entre dos eventos A y B es el conjunto de todos los puntos muestrales que es- 
tan en exactamente lino de los conjuntos y con frecuencia se denota como A A B. Observe que 
A A B = (A HB) U(A OS). Demuestre que P(A A B) = P(A) + P(B) - 2P(A fl B). 

2.132 Un avion esta extraviado y se presume que tiene igual probabilidad de caer en cualquiera de tres regio- 
nes. Si el avion cae realmente en la region i, denote con 1 - a, la probabilidad de que el avion sea hallado 
en una busqueda en la i-esima region, i = 1, 2, 3 . ^.Cual es la probabilidad conditional de que el avion 
se encuentre en la 

a region 1, dado que la busqueda en la region 1 fue infructuosa? 
b region 2, dado que la busqueda en la region 1 fue infructuosa? 
c region 3, dado que la busqueda en la region 1 fue infructuosa? 

2.133 Un estudiante contesta una pregunta de option multiple de un examen que ofrece cuatro posibles res- 
puestas. Suponga que la probabilidad de que el estudiante conozca la respuesta a la pregunta es .8 y la 
probabilidad de que el estudiante adivine es .2. Suponga que si el estudiante adivina, la probabilidad de 


3. Fuente: Wall Street Journal, © Dow Jones & Company, Inc. 1981. Todos los derechos reservados a nivel mun¬ 
dial. 
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que seleccione la respuesta correcta es .25. Si el estudiante contesta correctamente una pregunta, ^cual 
es la probabilidad de que realmente conozca la respuesta correcta? 

Hay dos metodos, Ay B, para ensenar cierta habilidad industrial. El porcentaje de no aprobados es 20% 
para A y 10% para B, pero B es mas costoso y por tanto se usa solo 30% del tiempo. (A es empleado el 
otro 70%.) A una trabajadora se le enseno la habilidad por uno de los dos metodos pero no la aprendio 
correctamente. ^Cual es la probabilidad de que se le haya ensenado por el metodo A? 

De los viajeros que llegan a un pequeno aeropuerto, 60% vuelan en Imeas aereas importantes, 30% en 
aviones de propiedad privada y el resto en aviones comerciales que no pertenecen a una lrnea aerea 
importante. De quienes viajan en lrneas aereas importantes, 50% viajan por negocios en tanto que 60% 
de quienes llegan en aviones privados y 90% de quienes llegan en otros aviones comerciales viajan por 
negocios. Suponga que seleccionamos al azar una persona que llega a este aeropuerto. ^.Cual es la pro¬ 
babilidad de que la persona 

a viaje por negocios?, 

b viaje por negocio en un avion privado?, 

c llegue en un avion privado. dado que la persona viaja por negocios?, 
d viaja por negocio. dado que vuela en un avion comercial? 

Un director de personal tiene dos listas de solicitantes para trabajos. La lista 1 contiene los nombres de 
cinco mujeres y dos hombres, mientras que la lista 2 contiene los nombres de dos mujeres y seis hom- 
bres. Un nombre se selecciona al azar de la lista 1 y se agrega a la lista 2. A continuacion se selecciona 
al azar un nombre de la lista 2 aumentada. Dado que el nombre seleccionado es de un hombre, ^cual es 
la probabilidad de que un nombre de mujer se haya seleccionado originalmente de la lista 1? 

Cinco tazones identicos estan marcados 1, 2, 3, 4 y 5. El tazon i contiene i bolas blancas y 5 - i bolas 
negras, con i — 1, 2, ... , 5. Un tazon se selecciona al azar y dos bolas se seleccionan al azar (sin restitu- 
cion) de el. 

a ^Cual es la probabilidad de que ambas bolas seleccionadas sean blancas? 

b Dado que ambas bolas seleccionadas son blancas, ^cual es la probabilidad de que el tazon 3 haya sido 
seleccionado? 

A continuacion esta una descripcion del juego de craps. Un jugador tira dos dados y calcula el total de 
puntos de sus caras superiores. Si el primer tiro del jugador es un 7 o un 11, el jugador gana el juego. Si 
el primer tiro es un 2, 3 o 12, el jugador pierde el juego. Si el jugador tira cualquier otra cosa (4, 5, 6, 8, 
9 o 10) en el primer tiro, el valor sera el punto del jugador. Si el jugador no gana ni pierde en el primer 
tiro, lanza los dados en forma repetida hasta que obtenga su punto o un 7. Gana si tira su punto antes de 
tirar un 7 y pierde si tira un 7 antes de su punto. ^Cual es la probabilidad de que el jugador gane un juego 
de craps? [Sugerencia: recuerde el Ejercicio 2.119.] 


Eventos numericos y variables aleatorias 

Los eventos de mayor interes para el cientffico, ingeniero u hombre de negocios son los iden- 
tificados por numeros, llamados eventos numericos. El medico investigador esta interesado en 
el evento de que diez de cada diez pacientes tratados sobreviva a una enfermedad; el hombre 
de negocios esta interesado en el evento de que sus ventas en el ano proximo lleguen a 5 mi- 
llones de dolares. Denote con Y una variable a ser medida en un experimento. Como el valor 
de Y varfa dependiendo del resultado del experimento, se denomina variable aleatoria. 

A cada punto del espacio muestral le asignaremos un numero real que denote el valor de la 
variable Y. El valor asignado a Y varfa de un punto muestral a otro, pero a algunos puntos se 
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FIGURA 2.14 
Division de 5 en sub- 
conjuntos que defi- 
nen los eventos 
Y= 0, 1, 2, 3 y4 



les puede asignar el mismo valor numerico. Entonces, hemos definido una variable que es una 
funcion de los puntos muestrales en S y {todos los puntos muestrales donde Y = a] es el evento 
numerico asignado al numero a. De hecho, el espacio muestral S se puede dividir en subcon- 
juntos para que a todos los puntos dentro de un subconjunto se les asigne el mismo valor de 
Y. Estos subconjuntos son mutuamente excluyentes porque a ningun punto se le asignan dos 
valores numericos diferentes. La division de S esta simbolicamente indicada en la Figura 2.14 
para una variable aleatoria que puede tomar valores 0, 1, 2, 3 y 4. 


DEFINICION 2.12 


Una variable aleatoria es una funcion de valor real para la cual el dominio es un espacio 
muestral. 


EJEMPLO 2.24 Definir unexperimento como lanzar dos monedas al airey observarlosresultados. Sea Kigual 
al numero de caras obtenido. Identifique los puntos muestrales en S, asigne un valor de Fa 
cada punto muestral e identifique los puntos muestrales asociados con cada valor de la varia¬ 
ble aleatoria Y. 

Solucion Represente con Hy T caray cruz, respectivamente, e identifique con un par ordenado de sim- 
bolos al resultado de las monedas primera y segunda. (Asf, HT implica una cara en la primera 
moneda y una cruz en la segunda.) Entonces los cuatro puntos muestrales en S son E t : HH, 
E 2 : HT, E 3 : TH y E 4 : TT. Los valores de Y asignados a los puntos muestrales dependen del 
numero de caras asociado con cada punto. Para E{. HH, se observaron dos caras, y a E i se le 
asigna el valor Y = 2. Del mismo modo, asignamos los valores Y = I a E 2 y E 3 , y Y = 0 a E A . 
Resumiendo, la variable aleatoria Y puede tomar tres valores, Y = 0, 1 y 2, que son eventos 
definidos por conjuntos de puntos muestrales: 

{y = 0} = {£ 4 }, {Y = 1} = {E 2 , E 3 }, {Y = 2} = {£!}. ■ 


Denote con y un valor observado de la variable aleatoria Y. Entonces P(Y = y ) es la suma 
de las probabilidades de los puntos muestrales a los que se asigna el valor y. 
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EJEMPLO 2.25 Calcule las probabilidades para cada valor de Y del Ejemplo 2.24. 


Solucion El evento {7=0} resulta solo del punto muestral E A . Si las monedas estan balanceadas, los 
puntos muestrales son igualmente probables; por tanto, 

P(Y = 0) = P(E 4 ) = 1/4. 


Del mismo modo, 


P(Y = 1) = P(E 2 ) + P(E 3 ) = 1/2 y P(Y = 2) = P(£j) = 1/4. ■ 


En los dos capftulos siguientes veremos un examen mas detallado de variables aleatorias. 

Ejercicios 

2.1 39 Consulte el Ejercicio 2.112. Con la variable aleatoria Y represente al numero de aparatos de radar que 
detectan un avion particular. Calcule las probabilidades asociadas con cada valor de Y. 

2.140 Consulte el Ejercicio 2.120. Con la variable aleatoria Y represente el numero de refrigeradores defectuo- 
sos hallados despues de probar tres de ellos. Calcule las probabilidades para cada valor de Y. 

2.141 Consulte de nuevo el Ejercicio 2.120. Con la variable aleatoria Y represente el numero de la prueba en 
la que se identifica el ultimo refrigerador defectuoso. Calcule las probabilidades para cada valor de Y. 

2.142 Un proyectil puede aterrizar en cualquiera de cuatro posiciones, A, B, C y D, con igual probabilidad. El 
proyectil se usa dos veces y la posicion se anota en cada vez. Con la variable aleatoria Y denote el numero 
de posiciones en las que el proyectil no aterrizo. Calcule las probabilidades para cada valor de Y. 


2.12 Muestreo aleatorio 

Como tema final en este capitulo pasamos de la teorfa a la aplicacion y examinamos la na- 
turaleza de experimentos realizados en estadfstica. Un experimento estadfstico involucra la 
observacion de una muestra seleccionada de un conjunto mas grande de datos, existente o 
conceptual, llamado poblacion. Las mediciones de la muestra, vistas como observaciones de 
los valores de una o mas variables aleatorias, se emplean entonces para hacer una inferencia 
acerca de las caracterfsticas de la poblacion objetivo. 

(i C6mo se hacen estas inferencias? Una respuesta exacta a esta pregunta se pospone para 
mas adelante, pero una observacion general se deduce de nuestra exposition en la Section 2.2. 
Ahi aprendimos que la probabilidad de la muestra observada desempena un importante papel 
para hacer una inferencia y evaluar su credibilidad. 

Sin extendernos sobre el punto, es claro que el metodo de muestreo afectara la probabilidad 
del resultado de una muestra particular. Por ejemplo, supongamos que una poblacion ficticia 
contiene solo N = 5 elementos, de los cuales pensamos tomar una muestra de tamano n = 2. 
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Se podrian revolver muy bien los elementos y seleccionar dos en forma tal que todos los pares 
de elementos tengan igual probabilidad de seleccion. Un segundo procedimiento de muestreo 
podrfa hacer necesario seleccionar un solo elemento, restituirlo en la poblacion y despues 
sacar de nuevo un solo elemento. Los dos metodos de seleccion de muestra se denominan 
muestreo sin y con reemplazo, respectivamente. 

Si los todos los elementos de la poblacion N = 5 son claramente diferentes, la probabilidad de 
sacar un par especifico, cuando se haga muestreo sin restitucion, es 1/10. La probabilidad 
de sacar el mismo par especifico, cuando se haga muestreo con restitucion, es 2/25. Con toda 
facilidad se pueden verificar estos resultados. 

Se debe hacer notar que el metodo de muestreo, conocido como disefio de un experimento, 
afecta la cantidad de information en una muestra y la probabilidad de observar un resultado 
especifico de muestra. Por tanto, todo procedimiento muestral debe describirse con claridad si 
deseamos hacer inferencias validas de muestra a poblacion. 

El estudio del diseno de experimentos, los diversos tipos de disenos junto con sus propieda- 
des, es en si mismo un curso. En consecuencia, en esta primera etapa de estudio presentamos 
solo el procedimiento de muestreo mas sencillo, el muestreo aleatorio simple. La notion de 
muestreo aleatorio simple sera necesaria en subsecuentes exposiciones de las probabilidades 
asociadas con variables aleatorias e inyectara algun realismo a nuestro examen de estadis- 
tica. Eso es porque el muestreo aleatorio simple se emplea frecuentemente en la practica. 
Definamos ahora el termino muestreo aleatorio. 


DEFINICION 2.13 Represente con N y n los numeros de elementos en la poblacion y la muestra, respectiva¬ 
mente. Si el muestreo se realiza en forma tal que cada una de las muestras tiene igual 
probabilidad de ser seleccionada, se dice que el muestreo es aleatorio y que el resultado 
es una muestra aleatoria. 


El muestreo aleatorio perfecto es dificil de alcanzar en la practica. Si la poblacion no es 
demasiado grande, podriamos escribir cada uno de los N numeros en fichas, revolverlas todas 
y seleccionar una muestra de n fichas. Los numeros de las fichas especificarian las mediciones 
que aparezcan en la muestra. 

En computadora se han elaborado tablas de numeros aleatorios para agilizar la seleccion 
de muestras aleatorias. Un ejemplo de esas tablas es la Tabla 12, Apendice 3. Una tabla de 
numero aleatorio es un conjunto de enteros (0, 1,..., 9) generado de modo que, a la larga, 
la tabla contendra los diez enteros en proporciones aproximadamente iguales, sin tendencias 
en las formas en las que los digitos se generan. En consecuencia, si un digito se selecciona de 
un punto aleatorio en la tabla, es igualmente probable que sea cualquiera de los digitos del 0 
al 9. 

Escoger numeros de la tabla es analogo a sacar fichas numeradas de una pila revuelta, como 
ya dijimos. Suponga que deseamos una muestra aleatoria de tres personas a seleccionarse de 
una poblacion de siete personas. Podriamos numerar las personas del 1 al 7, poner los nume¬ 
ros en fichas, revolver muy bien las fichas y luego sacar tres de ellas. De una forma analoga, 
podrian poner la punta de un lapiz en un punto inicial aleatorio de la Tabla 12, Apendice 3. 
Suponga que la punta cae en la linea 15 de la columna 9 y que decidimos usar el digito de la 
extrema derecha del grupo de cinco, que es un 5 en este caso. Este proceso es como sacar una 
ficha con el numero 5. Ahora proseguiriamos en cualquier direction para obtener los numeros 
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restantes de la muestra. Si decidimos continuar hacia abajo de la pagina, el siguiente numero 
(inmediatamente abajo del 5) es un 2. Entonces nuestra segunda persona muestreada serfa 
el numero 2. Continuando, llegamos a un 8 pero hay solo siete elementos en la poblacion. 
Entonces el 8 se pasa por alto y continuamos bajando por la columna; aparecen entonces dos 
numeros 5 pero ambos deben ser ignorados porque la persona 5 ya ha sido seleccionada. (La 
ficha numero 5 se ha retirado del monton.) Por ultimo, llegamos a un 1 y nuestra muestra de 
tres esta completa con personas numeradas 5, 2 y 1. 

Cualquier punto inicial se puede usar en una tabla de numeros aleatorios y podemos con¬ 
tinuar en cualquier direccion desde el punto inicial. No obstante, si se ha de usar mas de una 
muestra en cualquier problema, cada una debe tener un punto inicial unico. 

En muchas situaciones la poblacion es conceptual, como en una observacion hecha du¬ 
rante un experimento de laboratorio. Aquf la poblacion se visualiza como las infinitamente 
numerosas mediciones que se obtendrfan si el experimento fuera a repetirse una y otra vez. Si 
deseamos una muestra de n = 10 mediciones de esta poblacion, repetirfamos el experimento 
10 veces y esperarfamos que los resultados representen, con un grado razonable de aproxima- 
cion, una muestra aleatoria. 

Aun cuando el proposito principal de esta exposition fue aclarar el significado de una 
muestra aleatoria, nos gustarfa mencionar que algunas tecnicas de muestreo son solo parcial- 
mente aleatorias. Por ejemplo, si deseamos determinar la preferencia electoral de la nation en 
una election presidential, es probable que no escojamos una muestra aleatoria de la poblacion 
de votantes. Por pura casualidad, todos los votantes que aparezcan en la muestra podrfan ser 
sacados de una sola ciudad, San Francisco, por ejemplo, que no podrfa ser representativa de 
la poblacion de todos los votantes de Estados Unidos. Preferirfamos una selection aleatoria 
de votantes provenientes de distritos politicos mas pequenos, quiza estados, asignando un 
numero especffico a cada estado. La information de las submuestras seleccionadas al azar 
sacadas de los estados respectivos se combinarfa para formar una prediction respecto a toda 
la poblacion de votantes del pais. En general, deseamos seleccionar una muestra para obtener 
una cantidad especffica de information a un costo mfnimo. 


2.13 Resumen 

Este capftulo se ha ocupado de dar un modelo para la repetition de un experimento y, en con- 
secuencia, un modelo para las distribuciones de frecuencia de poblacion del Capftulo 1. La 
adquisicion de una distribution de probabilidad es el primer paso para formar una teorfa que 
modele la realidad y para desarrollar la maquinaria para hacer inferencias. 

Un experimento se definio como el proceso de hacer una observacion. Los conceptos de 
evento, evento simple, espacio muestral y los axiomas de probabilidad han dado un modelo 
probabilfstico para calcular la probabilidad de un evento. Los eventos numericos y la defini¬ 
tion de una variable aleatoria se introdujeron en la Section 2.11. 

Inherente al modelo es el metodo de punto muestral para calcular la probabilidad de un 
evento (Section 2.5). Las reglas de conteo utiles para aplicar el metodo de punto muestral se estu- 
diaron en la Section 2.6. El concepto de probabilidad conditional, las operaciones de algebra de 
conjuntos, asf como las leyes de probabilidad ponen el escenario para el metodo de composi¬ 
tion de evento para calcular la probabilidad de un evento (Section 2.9). 

( ',De que valor es la teorfa de probabilidad? Proporciona la teorfa y las herramientas para 
calcular las probabilidades de eventos numericos y por tanto las distribuciones de probabili- 
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dad para las variables aleatorias que se estudiaran en el Capftulo 3. Los eventos numericos 
de interes para nosotros aparecen en una muestra y vamos a calcular la probabilidad de una 
muestra observada para hacer una inferencia acerca de la poblacion objetivo. La probabilidad 
proporciona la base y las herramientas para la inferencia estadfstica, objetivo de la estadfs- 
tica. 
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Ejercicios complementarios 

2.143 Demuestre que el Teorema 2.7 se cumple para probabilidades condicionales. Esto es, si P(B ) > 0, en- 
tonces P(A\B) = 1 - P(A\B). 

2.144 Suponga que S contiene cuatro puntos muestrales, E v E 2 , E 3 y E 4 . 

a Haga una lista de todos los posibles eventos en S (incluyendo el evento nulo). 

b En el Ejercicio 2.68(d), se demostro que (") ~ ■ Use este resultado para dar el numero total 

de eventos en S. 

c Sean A y B los eventos j£j, E 2 , E 3 \ y {£ 0 , £ 4 }, respectivamente. Escriba los puntos muestrales en los 
siguientes eventos: AU B. AH B, AH B y AU B. 

2.145 Un paciente que se somete a un examen ffsico anual debe pasar por 18 verificaciones o pruebas. La 
secuencia en la que las pruebas se realizan es importante porque el tiempo perdido entre pruebas va 
a variar dependiendo de la secuencia. Si una experta en eficiencia fuera a estudiar las secuencias para 
hallar la que requirio menor tiempo, ^cuantas secuencias estarfan incluidas en su estudio si todas las 
posibles secuencias fueran admisibles? 

2.146 Se sacan cinco cartas de una baraja estandar de 52 cartas. ^Cual es la probabilidad de que las cinco sean 
del mismo “palo"? 

2.147 Consulte el Ejercicio 2.146. Un jugador ha recibido cinco cartas: dos ases, un rey, un cinco y un 9. El 
desecha el 5 y el 9 y recibe dos cartas mas. ^Cual es la probabilidad de que termine con un full! 
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2.148 Una tolva contiene tres componentes provenientes del proveedor A, cuatro del proveedor B y cinco del 
proveedor C. Si cuatro de los componentes se seleccionan al azar para probarlos, ^cual es la probabili- 
dad de que cada proveedor tenga al menos un componente probado? 

2.149 Un grupo grande de personas se examinara para ver si presentan dos smtomas comunes de cierta enfer- 
medad. Se piensa que 20% de las personas tienen solo el smtoma A, 30% solo el smtoma B, 10% tienen 
ambos smtomas y el resto no tiene ningun smtoma. Para una persona escogida al azar de este grupo, 
encuentre las siguientes probabilidades: 

a La persona no tiene ningun smtoma. 

b La persona tiene al menos un smtoma. 

c La persona tiene ambos smtomas, dado que tiene el smtoma B. 

2.150 Consulte el Ejercicio 2.149. Con la variable aleatoria Y represente el numero de smtomas que tiene una 
persona escogida al azar del grupo. Calcule las probabilidades asociadas con cada uno de los valores de Y. 

*2.151 Un modelo para la Serie Mundial Dos equipos A y B juegan una serie de partidos hasta que un equipo 
gane cuatro de ellos. Suponemos que los partidos se juegan de manera independiente y que la probabili- 
dad de que A gane cualquier juego es p. ^Cual es la probabilidad de que la serie dure exactamente cinco 
partidos? 

2.152 Sabemos lo siguiente acerca de un metodo colorimetrico que se utiliza para probar la existencia de ni- 
tratos en el agua de lagos. Si los especfmenes del agua contienen nitratos, una solucion que se aplica al 
agua hara que el especimen se vuelva rojo 95% de las veces. Cuando se usa en especfmenes de agua sin 
nitratos, la solucion hace que el agua se vuelva roja 10% de las veces (porque los elementos qufmicos 
que no sean nitratos se presentan ocasionalmente y tambien reaccionan al agente). La experiencia del 
pasado en un laboratorio indica que los nitratos estan contenidos en 30% de los especfmenes de agua 
que se envfan al laboratorio para someterlos a pruebas. Si un especimen de agua se selecciona al azar 

a de entre los enviados al laboratorio, ^,cual es la probabilidad de que se vuelva rojo cuando se pruebe?, 

b y si se vuelve rojo cuando se prueba, ^,cual es la probabilidad de que en realidad contenga nitratos? 

2.153 Algunos casos de historias clfnicas indican que diferentes enfermedades producen smtomas identicos. 
Suponga que un conjunto particular de smtomas, denotado como H , se presenta solo con cualquiera de 
tres enfermedades, I 2 o I 3 . Suponga que la presentacion simultanea de mas de una de estas enferme¬ 
dades es imposible y que 

PUi) = -01, P(h) = .005, P(I 3 ) = .02. 

Las probabilidades de desarrollar el conjunto de smtomas H, dada cada una de estas enfermedades, se 
sabe que son 

P(H\Ii) — .90, P{H\h) = .95, P(H\I 3 ) = .75. 

Suponiendo que una persona enferma presenta los smtomas, H, ^cual es la probabilidad de que la per¬ 
sona tenga la enfermedad 

2.154 a Un cajon contiene n = 5 pares de calcetines diferentes y distinguibles (un total de diez calcetines). Si 

una persona (quiza en la oscuridad) selecciona al azar cuatro calcetines, ^cual es la probabilidad de 
que no haya un par igual en la muestra? 

*b Un cajon contiene n pares de calcetines diferentes y distinguibles (un total de 2 n calcetines). Una 
persona selecciona al azar 2 r de los calcetines, donde 2 r < n. En terminos de n y r, ^cual es la pro¬ 
babilidad de que no haya un par igual en la muestra? 

2.155 Un grupo de hombres comparten las caracterfsticas de estar casados (A), tener un tftulo universitario 
(B) y ser ciudadanos de un estado especificado (C), de acuerdo con las fracciones dadas en el siguiente 
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diagrama de Venn. Esto es, 5% de los hombres tienen las tres caracterfsticas, mientras que 20% tienen 
education universitaria pero no estan casados y no son ciudadanos del estado especificado. Un hombre 
se selecciona al azar de este grupo. 



Encuentre la probabilidad de que el 
a sea casado, 

b tenga un tltulo universitario y sea casado, 

c no sea del estado especificado pero es casado y tiene un tltulo universitario, 
d no esta casado ni tiene tltulo universitario, dado que es del estado especificado. 

2.156 La siguiente tabla indica las muertes accidentales por edad y ciertos tipos especlficos para Estados 
Unidos en 2002. 

a Se supo que una persona seleccionada al azar de Estados Unidos tuvo una muerte accidental en 2002. 
Encuentre la probabilidad de que 
i haya tenido mas de 15 anos, 

ii la causa de su muerte haya sido un accidente automovillstico, 

iii la causa de su fuerte haya sido un accidente automovillstico, dado que la persona tenia entre 15 
y 24 anos de edad, 

iv La causa de su muerte haya sido por ahogamiento, dado que no fue un accidente automovillsti¬ 
co y que la persona tenia 34 anos o menos. 

b De estas cifras, ^se puede determinar la probabilidad de que una persona seleccionada al azar de la 
poblacion de Estados Unidos haya tenido un accidente automovillstico mortal en 2002? 




Tipo de accidente 


Edad 

Todos tipos 

Accidente 

automovillstico 

Calda 

Ahogamiento 

Menos de 5 

2,707 

819 

44 

568 

5-14 

2,979 

1,772 

37 

375 

15-24 

14,113 

10,560 

237 

646 

25-34 

11,769 

6,884 

303 

419 

35-44 

15,413 

6,927 

608 

480 

45-54 

12,278 

5,361 

871 

354 

55-64 

7,505 

3,506 

949 

217 

65-74 

7,698 

3,038 

1,660 

179 

75 o mas 

23,438 

4,487 

8,613 

244 

Total 

97,900 

43,354 

13,322 

3,482 


Fuente: compilado de National Vital Statistics Report 50, num.15, 2002. 
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2.157 

2.158 

2.159 

2.160 


2.161 

2.162 

2.163 


2.164 

2.165 

2.166 


Un estudio de los residentes de una region mostro que 20% eran fumadores. La probabilidad de muerte 
debida a cancer de pulmon si la persona fuma es diez veces mayor que la probabilidad de muerte si la 
persona no fuma. Si la probabilidad de muerte debida a cancer de pulmon en la region es .006, ^cual es 
la probabilidad de muerte debida a cancer de pulmon dado que la persona es fumadora? 

Un tazon contiene w bolas blancas y b bolas negras. Una bola se selecciona al azar del tazon, se anota 
su color y se devuelve al tazon junto con n bolas adicionales del mismo color. Otra bola individual 
se selecciona al azar del tazon (que ahora contiene w + b + n bolas) y se observa que la bola es 
negra. Demuestre que la probabilidad (condicional) de que la primera bola seleccionada sea blanca 
w 

6S w +b + n' 

Parece obvio que P(0) = 0. Demuestre que este resultado se deduce de los axiomas de la Definicion 

2 . 6 . 

Una maquina para producir un nuevo componente electronico experimental genera piezas defectuosas 
de vez en cuando en una forma aleatoria. El ingeniero supervisor para una maquina particular ha obser- 
vado que piezas defectuosas parecen estar agrupandose (es decir apareciendo de un modo no aleatorio), 
lo cual sugiere un mal funcionamiento en alguna parte de la maquina. Una prueba para la aleatoriedad 
se basa en el numero de lotes de piezas defectuosas y no defectuosas (un lote es una secuencia ininte- 
rrumpida de piezas defectuosas y no defectuosas). Cuanto mas pequeno es el numero de lotes, mayor 
sera la cantidad de evidencia que indica la no aleatoriedad. De 12 componentes sacados de la maquina, 
los primeros 10 no fueron defectuosos y los ultimos 2 fueron defectuosos (N N N N N N N N N N D D). 
Suponga que no hay aleatoriedad. ^.Cual es la probabilidad de observar 

a este arreglo (resultante en dos lotes) dado que 10 de los 12 componentes no son defectuosos? 
b dos lotes? 

Consulte el Ejercicio 2.160. (.Cual es la probabilidad de que el numero de lotes, R , sea menor o igual a 
3? 

Suponga que hay nueve espacios de estacionamiento juntos en un lote. Nueve autos necesitan ser esta- 
cionados por un empleado. Tres de los autos son costosos autos deportivos, tres son grandes autos de 
fabricacion nacional y tres son compactos importados. Suponiendo que el empleado estaciona los autos 
al azar, ^,cual es la probabilidad de que los tres costosos autos deportivos queden estacionados uno junto al 
otro? 

Los relevadores empleados en la construction de circuitos electricos funcionan de manera adecuada con 
probabilidad .9. Suponiendo que el circuito opera independientemente, ^.cual de los siguientes disenos 
de circuito da la mas alta probabilidad de que circule corriente cuando los relevadores se activen? 


1 —©— I 

J —<D— i 
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A B 


Consulte el Ejercicio 2.163 y considere el circuito A. Si sabemos que la corriente esta circulando, ^.cual 
es la probabilidad de que los interruptores 1 y 4 esten funcionando correctamente? 

Consulte el Ejercicio 2.163 y considere el circuito B. Si sabemos que la corriente esta circulando, (,cual 
es la probabilidad de que los interruptores 1 y 4 esten funcionando correctamente? 

Ocho neumaticos de marcas diferentes se clasifican del 1 al 8 (del mejor al peor) de acuerdo con las 
millas recorridas. Si cuatro de estos neumaticos son seleccionados al azar por un cliente, encuentre la 
probabilidad de que el mejor de entre los seleccionados por el cliente este en realidad clasificado tercero 
entre los ocho originales. 
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2.167 Consulte el Ejercicio 2.166. Denote con Y la clasificacion real de calidad del mejor neumatico selec- 
cionado por el cliente. En el Ejercicio 2.166 se calculo P(Y = 3). De los posibles valores de Y y las 
probabilidades asociadas con todos estos valores. 

2.168 A1 igual que en los Ejercicios 2.166 y 2.167, ocho neumaticos de diferentes marcas fueron clasificados 
del 1 al 8 (del mejor al peor) de acuerdo con las millas recorridas. 

a Si cuatro de estos neumaticos son seleccionados al azar por un cliente, ^cual es la probabilidad de que 
el mejor neumatico seleccionado sea clasificado 3 y el peor sea clasificado 7? 
b En el inciso a se calculo la probabilidad de que el mejor neumatico seleccionado este clasificado 3 y 
el peor este clasificado 7. Si ese es el caso, la amplitud de las clasificaciones, R = clasificacion mas 
grande - clasificacion mas pequena = 7-3 = 4. ^,Cual es P(R = 4)? 
c De todos los posibles valores para R y las probabilidades asociadas con todos estos valores. 

*2.169 Tres bebedores de cerveza (I, II y III) van a clasificar cuatro marcas diferentes de cerveza (A, B, C y D) 
en una prueba a ciegas. Cada bebedor clasifica las cuatro cervezas como 1 (para la cerveza que mas le 
gusto), 2 (para la siguiente mejor), 3 o 4. 

a Con todo cuidado describa un espacio muestral para este experimento (observe que necesitamos es- 
pecificar la clasificacion de las cuatro cervezas para los tres bebedores). ^Cuantos puntos muestrales 
hay en el espacio muestral? 

b Suponga que los bebedores no pueden discriminar entre las cervezas, de modo que cada asignacion 
de lugares a las cervezas es igualmente probable. Despues de que las cervezas han sido clasificadas 
por los bebedores, se suman los lugares de cada marca de cerveza. ^Cual es la probabilidad de que 
alguna cerveza reciba una clasificacion total de 4 o menos? 

2.170 Tres nombres se van a seleccionar de una lista de siete para una encuesta de opinion publica. Encuentre 
la probabilidad de que el primer nombre de la lista sea seleccionado para la encuesta. 

2.171 Un caso del servicio de noticias AP, impreso en el Gainesville Sun el 20 de mayo de 1979, indica lo 
siguiente con respecto a los restos del Skylab que golpearon a alguien en tierra: “Las probabilidades son 
1 en 150 de que una pieza del Skylab golpee a alguien. Pero 4 mil millones de personas... viven en la 
zona en la que podrfan caer piezas. Entonces, las probabilidades de que cualquier persona sea golpeada 
son una en 150 por 4 mil millones o sea una en 600 mil millones”. i Ve el lector algunas imprecisiones 
en este razonamiento? 

2.172 Sean Ay B dos eventos. ^Cuales de los siguientes planteamientos, en general, son falsos? 

a P(A\B) + P{A\B) = 1. 
b P{A\B) + P(A\B) = 1. 
c P(A\B) + P{A\B) = 1. 

2.173 A medida que salen piezas del final de una lfnea de produccion, un inspector selecciona cuales han de 
someterse a una inspeccion completa. Diez por ciento de todas las piezas producidas son defectuosas. 
Sesenta por ciento de todas las piezas defectuosas pasan por una inspeccion completa y 20% de todas 
las piezas en buenas condiciones pasan por una inspeccion completa. Dado que una pieza se inspecciona 
por complete, ^cual es la probabilidad de que sea defectuosa? 

2.174 Muchas escuelas publicas estan poniendo en practica una regia de “pasa o no pasa” para atletas. De 
acuerdo con este sistema, un estudiante que no apruebe un curso es descalificado para participar en ac- 
tividades extracurriculares durante el siguiente periodo de calificacion. Suponga que la probabilidad es 
.15 de que un atleta que no ha sido descalificado previamente sea descalificado en el siguiente periodo. 
Para atletas que han sido descalificados previamente, la probabilidad de descalificacion en el siguiente 
periodo es .5. Si 30% de los atletas han sido descalificados en periodos previos. ^,cual es la probabilidad 
de que un atleta seleccionado al azar sea descalificado durante el siguiente periodo de calificacion? 
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2.175 


2.176 


2.177 


*2.178 


*2.179 


*2.180 


*2.181 


Se dice tres eventos. A, By C que son mutuamente independientes si 

P(A OS) = P(A) X P(B), P(B PIC) = P(B) X P(C), 

P(A nc) = P(A) x P(C), P(A hb nc) = P(A) x P(B) x p(C). 


Suponga que una moneda balanceada se lanza al aire dos veces, de manera independiente. Defina los 
siguientes eventos: 

A: aparece una cara en el primer tiro. 

B: aparece una cara en el segundo tiro. 

C: ambos tiros dan el mismo resultado. 
lA, By C son mutuamente independientes? 

Consulte el Ejercicio 2.175 y suponga que los eventos A, By C son mutuamente independientes. 
a Demuestre que (AUfi)yC son independientes. 
b Demuestre que A y (B PI C) son independientes. 

Consulte el Ejercicio 2.90(b) donde un amigo dijo que si hay 1 en 50 probabilidades de lesion en un solo 
salto, entonces hay un 100% de probabilidad de lesion si un paracaidista salta 50 veces. Suponga que 
los resultados de saltos repetidos son mutuamente independientes. 
a ^Cual es la probabilidad de que se completen 50 saltos sin una lesion? 
b ^Cual es la probabilidad de que ocurra al menos una lesion en 50 saltos? 

c ^Cual es el numero maximo de saltos, n, que el paracaidista puede hacer si la probabilidad es al me¬ 
nos .60 de que los n saltos se completen sin lesion? 

Suponga que la probabilidad de exposicion a la gripe durante una epidemia es .6. La experiencia ha 
demostrado que un suero tiene 80% de exito para prevenir que una persona inoculada contraiga la gripe 
si se expone a ella. Una persona no inoculada enfrenta una probabilidad de .90 de contraer la gripe si se 
expone a ella. Dos personas, una inoculada y otra no, realizan un trabajo altamente especializado en un 
negocio. Suponga que no estan en el mismo lugar, no estan en contacto con las mismas personas y no 
pueden contagiarse entre si a la gripe. ^Cual es la probabilidad de que al menos una de ellas se enfer- 
me? 

Dos jugadores apuestan $1 cada uno en los tiros sucesivos al aire de una moneda. Cada uno tiene una 
banca de $6. ^Cual es la probabilidad de que 
a salgan a mano despues de seis tiros de la moneda?, 

b un jugador, Jones, por ejemplo, gane todo el dinero en el decimo tiro de la moneda? 

Suponga que las calles de una ciudad son trazadas en una cuadrfcula con calles corriendo de norte a sur 
y de este a oeste. Considere el siguiente esquema para patrullar una zona de 16 manzanas por 16 man- 
zanas. Un oficial empieza a caminar en el crucero del centra de la zona. En la esquina de cada manzana 
el oficial elige al azar ir al norte, sur, este u oeste. ^Cual es la probabilidad de que el oficial 
a llegue al lfmite de la zona de patrullaje despues de caminar las primeras 8 manzanas?, 
b regrese al punto de partida despues de caminar exactamente 4 manzanas?, 

Suponga que n pelotas que no se pueden distinguir unas de otras se van a acomodar en N cajas que sf se 
pueden distinguir, de modo que cada arreglo distinguible sea igualmente probable. Si n & N, demuestre 
que la probabilidad de que no haya una caja vacfa esta dada por 



(N + n - 1\ ' 

V N-l ) 
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3.1 Definicion basica 

Como ya dijimos en la Seccion 2.12, una variable aleatoria es una funcion de valor real defi- 
nida sobre un espacio muestral. Por tanto, una variable aleatoria se puede usar para identificar 
eventos numericos que son de interes en un experimento. Por ejemplo, el evento de interes 
en un sondeo de opinion con respecto a las preferencias de votantes no suele ser la persona 
particular muestreada o el orden en el que se obtuvieron las preferencias, sino Y = el numero 
de votantes que estan a favor de cierto candidato o tema. El valor observado de esta variable 
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aleatoria debe ser cero o un entero entre 1 y el tamano muestral. Entonces, esta variable alea¬ 
toria puede tomar solo un numero finito de valores con probabilidad diferente de cero. Se dice 
que una variable aleatoria de este tipo es discreta. 


DEFINICION 3.1 Se dice que una variable aleatoria Y es discreta si puede tomar solo un numero finito o 
contablemente infinito 1 de valores distintos. 


Se puede obtener una caracterizacion menos formidable de variables aleatorias discretas si 
se consideran algunos ejemplos practicos. El numero de bacterias por unidad de area en el 
estudio de control de medicamentos sobre el crecimiento de bacterias es una variable aleatoria 
discreta, como lo es el numero de televisores defectuosos en un envfo de 100 aparatos. De 
hecho, las variables aleatorias discretas representan con frecuencia cantidades asociadas con 
fenomenos reales. 

Consideremos ahora la relation entre el material del Capftulo 2 y el de este capftulo. ^Por 
que estudiar la teorfa de probabilidad? La respuesta es que se necesita la probabilidad de un 
evento observado para hacer inferencias acerca de una poblacion. Los eventos de interes son 
con frecuencia numericos y corresponden a valores de variables aleatorias discretas. Por tanto, 
es imperativo que conozcamos las probabilidades de estos eventos numericos. Como ciertos 
tipos de variables aleatorias se presentan frecuentemente en la practica, es util tener a mano la 
probabilidad para cada valor de una variable aleatoria. Este conjunto de probabilidades recibe 
el nombre de distribucion de probabilidad de la variable aleatoria discreta. Encontraremos 
que numerosos experimentos muestran caracterfsticas similares y generan variables aleato¬ 
rias con el mismo tipo de distribucion de probabilidad. En consecuencia, el conocimiento 
de las distribuciones de probabilidad para variables aleatorias asociadas con tipos comunes de 
experimentos eliminara la necesidad de resolver los mismos problemas de probabilidad una 
y otra vez. 


3.2 La distribucion de probabilidad para 
una variable aleatoria discreta 

De modo notacional, usaremos una letra mayuscula, por ejemplo Y, para denotar una variable 
aleatoria y una letra minuscula, por ejemplo y, para denotar un valor particular que puede 
tomar una variable aleatoria. Por ejemplo, denotemos con Y cualquiera de los seis posibles 
valores que podrfan ser observados en la cara superior cuando se tira un dado. Despues de tirar 
el dado, el numero observado sera denotado por el sfmbolo y. Observe que Y es una variable 
aleatoria, pero el valor especffico observado, y, no es aleatorio. 

La expresion (Y = y) se puede leer como el conjunto de todos los puntos en S a los que la 
variable aleatoria Y asigna el valor y. 

Ahora es significativo hablar de la probabilidad de que Y tome el valor y, denotado por P(Y 
= y). A1 igual que en la Section 2.11, esta probabilidad esta definida como la suma de las 
probabilidades de puntos muestrales apropiados en S. 


1. Recuerde que un conjunto de elementos es contablemente infinito si los elementos del conjunto se pueden poner 
en correspondencia biumvoca con los enteros positivos. 
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DEFINICION 3.2 

La probabilidad de que Y tome el valor y, P(Y = y), se define como la suma de las pro- 
babilidades de todos los puntos muestrales en S a los que se asigna el valor y. A veces 
denotaremos P(Y = y) por p(y). 

Como p(y) es una funcion que asigna probabilidades a cada valor y de la variable aleatoria 
Y, a veces recibe el nombre definition de probabilidad para Y. 

DEFINICION 3.3 

La distribution de probabilidad para una variable discreta Y puede ser representada por 
una formula, una tabla o una grafica que produzca p(y) = P(Y = y) para toda y. 

Notese que p(y) > 0 para toda y, pero la distribucion de probabilidad para una variable 
aleatoria discreta asigna probabilidades diferentes de cero a solo un numero contable de valo- 
res y distintos. Se entiende que cualquier valor y no explfcitamente asignado a una posibilidad 
positiva es tal que p(y) = 0. Ilustramos estas ideas con un ejemplo. 

EJEMPLO 3.1 

Un supervisor en una planta manufacturera tiene tres hombres y tres mujeres trabajando para 
el y desea escoger dos trabajadores para un trabajo especial. No queriendo mostrar sesgo en 
su seleccion, decide seleccionar los dos trabajadores al azar. Denote con Y el numero de mu¬ 
jeres en su seleccion. Encuentre la distribucion de probabilidad para Y. 

Solucion 

El supervisor puede seleccionar dos trabajadores de entre seis en (,) = 15 formas. Entonces, 
S contiene 15 puntos muestrales que suponemos son igualmente probables porque se em- 
pleo muestreo aleatorio. Asl, P(Ei) = 1/15, para i = 1, 2 ,..., 15. Los valores para Y que 
tienen probabilidad diferente de cero son 0, 1 y 2. El numero de formas de seleccionar 
Y = 0 mujeres es (q)(|) porque el supervisor debe seleccionar cero trabajadores de las tres mu¬ 
jeres y dos de los tres hombres. Entonces, hay (/)(/) = 1 • 3 = 3 puntos muestrales en el evento 
Y= 0,y 

(0X2) 3 1 

^0) = ^ = 0)- 15 = 15 =5- 

Del mismo modo, 

p{\) ~ P(Y - 1) - - 9 - 3 , 

7 15 15 5 

( 2 ) ( 0 ) 3 1 

o(2) - P(Y ~ 2) - V2Ao ' - - . 

' 15 15 5 

Observe que (Y = 1) es por mucho el resultado mas probable. Esto debe parecer razonable 
porque el numero de mujeres es igual al de hombres en el grupo original. ■ 


La tabla para la distribucion de probabilidad de la variable aleatoria Y considerada en el 
Ejemplo 3.1 se resume en la Tabla 3.1. La misma distribucion se da en forma grafica en la 
Figura 3.1. Si consideramos el ancho de cada barra de la Figura 3.1 como una unidad, enton- 
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FIGURA 3.1 
Histograma de 
probabilidad para 
la Tabla 3.1 


TEOREMA 3.1 


Tabla 3.1 Distribucion de probabilidad 
para el Ejemplo 3.1 


y 

p(y) 

0 

1/5 

l 

3/5 

2 

1/5 



ces el area de una barra es igual a la probabilidad de que Y tome el valor sobre el cual esta 
centrada la barra. Este concepto de areas que representan probabilidades se introdujo en la 
Seccion 1.2. 

El metodo mas conciso para representar distribuciones de probabilidad discretas es por medio 
de una formula. Para el Ejemplo 3.1, vemos que la formula para p(y) se puede escribir como 


p(y) 



y =o, l, 2. 


Observe que las probabilidades asociadas con todos los valores distintos de una variable 
aleatoria discreta deben sumar 1. En resumen, las siguientes propiedades deben cumplirse 
para cualquier distribucion de probabilidad discreta: 


Para cualquier distribucion de probabilidad discreta, lo siguiente debe ser verdadero: 

1. Os p{y) < 1 para toda y. 

2. P(y ) = 1- donde la sumatoria es para todos los valores de y con probabilidad 
diferente de cero. 


Como ya se menciono en la Seccion 1.5, las distribuciones de probabilidad que dedujimos 
son modelos, no representaciones exactas, por las distribuciones de frecuencia de poblaciones 
de datos reales que ocurren (o serfan generadas) en la naturaleza. Entonces, son modelos para 
distribuciones reales de datos semejantes a las distribuciones examinadas en el Capftulo 1. Por 
ejemplo, si fueramos a seleccionar al azar dos trabajadores de entre los seis descritos en el 
Ejemplo 3.1, observarfamos un solo valor y. En este caso el valor y observado serfa 0, 1 o 2. Si 
el experimento se repitiera muchas veces, se generarfan numerosos valores y. Un histograma de 
frecuencia relativa para los datos resultantes, construido en la forma descrita en el Capftulo 1, 
serfa muy similar al histograma de probabilidad de la Figura 3.1. 
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Estos estudios de simulation son muy utiles. A1 repetir algunos experimentos una y otra vez 
podemos generar mediciones de variables aleatorias discretas que tienen distribuciones de 
frecuencia muy semejantes a las distribuciones de probabilidad deducidas en este capftulo, 
reforzando la conviction de que nuestros modelos son muy precisos. 


Ejercicios 

3.1 Cuando el departamento de salud examino pozos privados en un condado en busca de dos impurezas que 
comunmente se hallan en el agua potable, se encontro que 20% de los pozos no tenfan ninguna impureza, 
40% tenfan la impureza A y 50% tenfan la impureza B. (Obviamente, algunos tenfan ambas impurezas.) Si 
un pozo de los existentes en el condado se escoge al azar, encuentre la distribucion de probabilidad para Y, 
el numero de impurezas halladas en el pozo. 

3.2 Usted y un amigo participan en un juego donde cada uno tira al aire una moneda balanceada. Si las caras 
superiores de las monedas son cruces en ambos casos, el lector gana $1; si salen caras en ambos tiros, 
gana $2; si las caras de las monedas no son iguales (cara en una y cruz en la otra), el lector pierde $1 
(gana (-$1)). Obtenga la distribucion de probabilidad para sus ganancias, Y, en un solo intento. 

3.3 Se sabe que un grupo de cuatro componentes dos de ellos son defectuosos. Una inspectora prueba los 
componentes uno por uno hasta hallar los dos defectuosos. Una vez que los localiza, suspende la prueba 
pero el segundo defectuoso es probado para asegurar la precision. Denote con Y el numero de la prueba en 
la que se hallo el segundo componente defectuoso. Encuentre la distribucion de probabilidad para Y. 

3.4 Considere un sistema de agua que circula por valvulas de A a B. (Vea el diagrama siguiente.) Las valvulas 
1, 2 y 3 operan de manera independiente y cada una abre correctamente a una serial con probabilidad .8. 
Encuentre la distribucion de probabilidad para Y, el numero de trayectorias abiertas de A a B despues que 
se da la serial. (Observe que Y puede tomar los valores 0, 1 y 2.) 


1 



2 3 


3.5 Un problema en un examen aplicado a ninos pequenos les pide relacionar cada una de tres imagenes de 
animales con la palabra que identifica a ese animal. Si un nino asigna las tres palabras al azar a las tres 
imagenes, encuentre la distribucion de probabilidad para F, el numero de pares correctos. 

3.6 Cinco pelotas numeradas 1, 2, 3, 4 y 5 se ponen en una uma. Dos de ellas se seleccionan al azar de entre 
las cinco y se toma nota de sus numeros. Encuentre la distribucion de probabilidad para lo siguiente: 

a El mayor de los dos numeros muestreados. 
b La suma de los dos numeros muestreados. 

3.7 Cada una de tres bolas se colocan al azar en uno de tres tazones. Encuentre la distribucion de probabili¬ 
dad para Y = el numero de tazones vacfos. 

3.8 Una sola celula puede morir, con probabilidad . 1 o dividirse en dos celulas, con probabilidad .9, producien- 
do una nueva generacion de celulas. Cada celula en la nueva generation muere o se divide independien- 
temente en dos celulas, con las mismas probabilidades que la celula initial. Encuentre la distribucion de 
probabilidad para el numero de celulas de la siguiente generacion. 
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3.9 Para verificar la exactitud de sus cuentas financieras, las empresas emplean regularmente auditores para 
verificar asientos de contabilidad. Los empleados de la companfa hacen asientos erroneos 5% de las 
veces. Suponga que un auditor verifica al azar tres asientos. 

a Encuentre la distribucion de probabilidad para Y, el numero de errores detectados por el auditor, 
b Construya un histograma de probabilidad para p(y). 
c Encuentre la probabilidad de que el auditor detecte mas de un error. 

3.10 Una agenda de rentas, que alquila equipo pesado por dfa, ha encontrado que, en promedio, se renta una 
costosa maquina solo un dfa de cada cinco. Si la renta en un dfa es independiente de la renta en cualquier 
otro dfa, encuentre la distribucion de probabilidad de Y, el numero de dfas entre un par de rentas. 

3.11 Las personas que entran a un banco de sangre son tales que 1 de cada 3 tienen tipo de sangre 0 + y 1 de 
cada 15 tienen sangre tipo CT. Considere tres donantes seleccionados al azar para el banco de sangre. 
Denote con X el numero de donadores con sangre tipo 0 + y denote con Y el numero con sangre tipo CT. 
Encuentre las distribuciones de probabilidad para X y Y. Tambien encuentre la distribucion de probabi¬ 
lidad para X + Y, el numero de donadores que tienen tipo de sangre O. 


3.3 El valor esperado de una variable aleatoria 
o una funcion de una variable aleatoria 

Hemos observado que la distribucion de probabilidad para una variable es un modelo teorico 
para la distribucion empfrica de datos asociados con una poblacion real. Si el modelo es una 
representation precisa de la naturaleza, las distribuciones teoricas y empfricas son equivalen- 
tes. En consecuencia, al igual que en el Capftulo 1, tratamos de hallar la media y la varianza 
para una variable aleatoria y por tanto adquirir medidas numericas descriptivas, pardrne- 
tros, para la distribucion de probabilidad p(y) que son consistentes con las estudiadas en el 
Capftulo 1. 

DEFINICION 3.4 Sea Y una variable aleatoria discreta con la funcion de probabilidad p(y). Entonces el 
valor esperado de Y, E(Y), se define como 2 

E(Y) = 

y 


Si ply) es una caracterizacion precisa de la distribucion de frecuencia poblacional, entonces 
E(Y) = p es la media poblacional. 

La Definicion 3.4 es completamente consistente con la definicion de la media de un con- 
junto de mediciones que se dio en la Definicion 1.1. Por ejemplo, considere una variable alea¬ 
toria discreta Y que puede tomar valores 0, 1 y 2 con distribucion de probabilidad p(y) como 

2. Para ser precisos, se dice que el valor esperado de una variable aleatoria discreta existe si la suma, como se dio 
antes, es absolutamente convergente, es decir, si 


£|y|/>(y)<°°. 

Esta convergencia absoluta se cumplira para todos los ejemplos de este texto y no se mencionara cada vez que se 
defina un valor esperado. 
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Tabla 3.2 

Distribucion de probabilidad 

para Y 


y 

p{y) 

0 

1/4 

l 

1/2 

2 

1/4 


FIGURA 3.2 
Distribucion 
de probabilidad 
para Y 



se muestra en la Tabla 3.2 y el histograma de probabilidad de la Figura 3.2. Una inspection 
visual revelara que la media de la distribucion esta ubicada en y = 1. 

Para demostrar que E(Y) = 5Z yp(y) es la media de la distribucion de probabilidad p(y), 
suponga que el experimento se realizo 4 millones de veces, dando 4 millones de valores ob- 
servados para Y. Si observamos p(y) de la Figura 3.2, esperariamos que aproximadamente 
1 millon de los 4 millones de repeticiones se manifieste en el resultado Y = 0, 2 millones en 
Y = 1 y 1 millon en Y = 2. Para hallar el valor medio de Y, promediamos estos 4 millones de 
mediciones y obtenemos 

_ £■=, y, _ (1,000,000)(0) + (2,000,000)(1) + (1,000,000)(2) 

M n 4,000,000 

= (0)(l/4)+(l)(l/2)+(2)(l/4) 

2 

= X>00 = 1 - 

y=0 


Entonces, E(Y) es un promedio, y la Definicion 3.4 es consistente con la definicion de una 
media dada en la Definicion 1.1. Del mismo modo, frecuentemente estamos interesados en 
la media o el valor esperado de una funcion de una variable aleatoria Y. Por ejemplo, las molecu- 
las en el espacio se mueven a velocidades que varfan, donde Y, la velocidad de una molecula 
determinada, es una variable aleatoria. La energfa transmitida al impactarse con un cuerpo 
en movimiento es proporcional al cuadrado de la velocidad. En consecuencia, para hallar la 
cantidad media de energfa transmitida por una molecula en el impacto, debemos hallar el valor 
medio de Y 2 . Lo que es mas importante, observamos en la Definicion 1.2 que la varianza de 
un conjunto de mediciones es la media del cuadrado de las diferencias entre cada valor del 
conjunto de mediciones y su media o el valor medio de (Y— pi) 2 . 
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TEOREMA 3.2 


Demostracion 


DEFINICION 3.5 


Sea Y una variable aleatoria discreta con funcion de probabilidad p(y) y sea g(Y) una 
funcion de valor real de Y. Entonces, el valor esperado de g{Y) esta dado por 

E[g(Y)] = £g(y)p(y). 

today 

Demostramos el resultado en el caso que la variable aleatoria Y toma el numero finito 
de valores y v y 2 , ■ ■ ■, y n - Como la funcion g(y) puede no ser biunfvoca, suponga que g(Y) 
toma valores g v g 2 ,..., g m (donde m < n). Se deduce que g( Y) es una variable aleatoria 
tal que para i = 1,2,..., m, 

P[g(Y) = gi] = Y P(jj) = P*(gi )• 

toda y. tal que 

yj)=gt 

Entonces, por la Definicion 3.4, 


E[g(Y)} = YsiP*(8i) 

i =1 

m ( 

i = l i toda yj tal que 

g(.yj)=gi 

m 

= Y JlsiPiyj) 

i = 1 toda yj tal que 

giyj)=g: 

n 

7=1 


Regresemos ahora a nuestro objetivo inmediato, hallar medidas numericas descriptivas 
(o pardmetros ) para caracterizar p(y). Como ya dijimos, E(Y) proporciona la media de la 
poblacion con distribucion dada por/7(y). A continuacion buscamos la varianza y la des- 
viacion estandar de esta poblacion. El lector recordara del Capftulo 1 que la varianza de 
un conjunto de mediciones es el promedio del cuadrado de las diferencias entre los valo¬ 
res de un conjunto de mediciones y su media. Entonces, deseamos hallar el valor medio de 
la funcion g(Y) = (Y- pi) 2 . 


Si Y es una variable aleatoria con media E(Y) = pi. la varianza de una variable aleatoria 
Y se define como el valor esperado de (Y- pi) 2 . Esto es, 

V(Y) = E[{Y- pi) 2 ]. 

La desviacion estandar de Y es la raiz cuadrada positiva de V(Y). 


Si p(y) es una caracterizacion precisa de la distribucion de frecuencia poblacional (y para 
simplificar la notacion, supondremos que esto es cierto), entonces E( Y) = p. V( Y) = a 2 , la 
varianza poblacional, y cr es la desviacion estandar poblacional. 
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EJEMPLO 3.2 


FIGURA 3.3 
Histograma de 
probabilidad para el 
Ejemplo 3.2 


La distribucion de probabilidad para una variable aleatoria Y esta dada en la Tabla 3.3. 
Encuentre la media, la varianza y la desviacion estandar de Y. 


Tabla 3.3 
para Y 

Distribucion de probabilidad 

y 

p(y) 

0 

1/8 

1 

1/4 

2 

3/8 

3 

1/4 


Solucion Por las Definiciones 3.4 y 3.5, 

3 

P = E(Y) = ^yp(v) = (0)(l/8) + (1)( 1/4) + (2)(3/8) + (3)(l/4) = 1.75, 

y=0 

3 

O- 2 = E[(Y - /r) 2 ] = - p) 2 p(y) 

y=0 

= (0 - 1,75) 2 ( 1 /8) + (1 - 1,75) 2 ( 1 /4) + (2 - 1,75) 2 (3/8) + (3 - 1,75) 2 ( 1 /4) 

= .9375, 

a = +V^2 = V.9375 = .97. 

El histograma de probabilidad se muestra en la Figura 3.3. Localice /j. en el eje de medicion 
y observe que ubica el “centro” de la distribucion de probabilidad no simetrica de Y. Tambien 
observe que el intervalo (/jl ± cr) contiene los puntos discretos Y = 1 y Y = 2, que constituyen 
5/8 de la probabilidad. Asi, la regia empfrica (Capftulo 1) proporciona una aproximacion 
razonable a la probabilidad de una medicion que cae en este intervalo. (Recuerde que las 
probabilidades se concentran en los puntos Y = 0, 1, 2 y 3 porque Y no puede tomar valores 
intermedios.) 



Sera util adquirir unas pocas herramientas y definiciones adicionales antes de tratar de 
hallar los valores y varianzas esperados de variables aleatorias discretas mas complicadas, por 
ejemplo la binomial o de Poisson. Es asf que presentamos tres utiles teoremas de expectativa 
que se deducen directamente de la teorfa de sumatoria. (Otras tecnicas utiles se presentan en 
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las Secciones 3.4 y 3.9.) Para cada teorema suponemos que Y es una variable aleatoria discreta 
con funcion de probabilidad piy). 

El primer teorema expresa el resultado mas bien obvio de que la media o valor esperado de 
una cantidad no aleatoria c es igual a c. 


TEOREMA 3.3 

Demostracion 

El segundo teorema expresa que el valor esperado del producto de una constante c por una 
funcion de una variable aleatoria es igual a la constante multiplicada por el valor esperado de 
la funcion de la variable. 

TEOREMA 3.4 

Demostracion 

El tercer teorema expresa que la media o valor esperado de una suma de funciones de una 
variable aleatoria Y es igual a la suma de sus respectivos valores esperados. 

TEOREMA 3.5 

Demostracion 

Los Teoremas 3.3, 3.4 y 3.5 se pueden usar de inmediato para desarrollar un teorema util 
para hallar la varianza de una variable aleatoria discreta. 


Sea Y una variable aleatoria discreta con funcion de probabilidad piy) y sean g^Y), g 2 (Y),..., 
g k (Y) k funciones de Y. Entonces 

E[ gl (Y) + g 2 (Y) + ... + g k (Y)] = E[g l (Y)]+E[g 2 (Y)]+--- + E[g k (Y)]. 

Demostraremos la prueba solo para el caso k = 2, pero pasos analogos se cumpliran para 
cualquier k finita. Por el Teorema 3.2, 

E[g\(Y) + g 2 (Y) ] = ^[gi(y) + gi(y)]p(y) 

y 

= ^2gi(y)p(y) + ^2g2(y)p(y) 
y y 

= E[ 8l (Y)] + E[g 2 (Y)l 


Sea Y una variable aleatoria discreta con funcion de probabilidad piy), g(Y) una funcion 
de Y y c una constante. Entonces 

E[cg(Y)] = cE[g(Y)]. 

Por el Teorema 3.2, 

£[cg(T)] = ^cg(v)p(v) = c^g(v)p(v) = cE[g{Y)}. 

y y 


Sea Y una variable aleatoria discreta con funcion de probabilidad piy) y sea c una cons¬ 
tante. Entonces E(c ) = c. 

Considere la funcion g(Y) = c. Por el Teorema 3.2, 

E(c) = ^cpiy) =c^2p(y). 

y y 

Pero ^2yP(y) = 1 (Teorema 3.1) y, por tanto, E(c) = c(l) = c. 
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TEOREMA 3.6 Sea 7una variable aleatoria discreta con funcion de probabilidad p(y) y media E(y) = /x; 

entonces 

V(Y) =<t 2 = E[(Y - /x) 2 ] = E{Y 2 ) - p 2 . 

Demostracion a 2 = E[{Y - p) 2 ] = E(Y 2 - 2pY + /x 2 ) 

= E(Y 2 ) - E(2pY) + E(p 2 ) (por el Teorema 3.5). 

Si se observa que /x es una constante y se aplican los Teoremas 3.4 y 3.3 a los terminos 
segundo y tercero, respectivamente, tenemos 

o- 2 = E(Y 2 ) - 2pE(Y) + /x 2 . 

Pero /x = E(Y) y, por tanto, 

a 2 = E(Y 2 ) - 2p 2 + p 2 = E(Y 2 ) - p 2 . 


En ocasiones el Teorema 3.6 reduce considerablemente el trabajo de hallar la varianza 
de una variable aleatoria discreta. Demostraremos la utilidad de este resultado al calcular de 
nuevo la varianza de la variable aleatoria considerada en el Ejemplo 3.2. 


EJ EM PLO 3.3 Use el Teorema 3.6 para hallar la varianza de la variable aleatoria Y en el Ejemplo 3.2. 
Solucion La media /x = 1.75 se encontro en el Ejemplo 3.2. Como 

E(Y 2 ) = J2 y 2 PW = (Oft 1 / 8 ) + (1) 2 ( 1/4) + (2) 2 (3/8) + (3) 2 (l/4) = 4, 

y 

el Teorema 3.6 dice que 

a 2 = E(Y 2 ) - pr = 4 - (1.75) 2 = .9375. ■ 


EJ EMPLO 3.4 El gerente de una planta industrial esta planeando comprar una nueva maquina ya sea del tipo A 
o del B. Si t denota el numero de horas de operacion diaria, el numero Pj de reparaciones 
diarias requeridas para mantener una maquina de tipo A es una variable aleatoria con media 
y varianza iguales a .10/. El numero Y n de reparaciones diarias para una maquina de tipo B es 
una variable aleatoria con media y varianza iguales a .12/. El costo diario de operacion A 
es Ca(/) = 10/ + 307 2 ; para B es Cb(/) = 8 / + 307 ^- Suponga que las reparaciones toman 
un tiempo insignificante y que cada noche las maquinas se afinan para que puedan operar 
esencialmente como maquinas nuevas al empezar el dfa siguiente. ( ',Cual maquina minimiza 
el costo diario esperado si un dfa de trabajo consta de (a) 10 horas y (b) 20 horas? 
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Solution El costo diario esperado para A es 


E[C A (t)] = £[10? + 30E 2 ] = 10? + 30 E(Y 2 ) 

= 10? + 30{y<Ti) +[E(Ei)] 2 } = 10? + 30[. 10? +(.10?) 2 ] 

= 13? + .3? 2 . 

En este calculo, usamos los valores conocidos para ViY^ y E( K,) y el hecho de que 
V(Yi) = E{Y 2 ) - [£(Ei)] 2 para obtener que E(Y 2 ) = V(Y { ) + [£(Ei)] 2 =.10? + 

(. 10?) 2 . De manera similar, 

E[C B (t )] = £[8? + 3OE2] = 8? + 30 E(Y 2 ) 

= 8? + 30{V (Y 2 ) + [E{Y 2 )] 2 } = 8? + 30[. 12? + (. 12?) 2 ] 

= 11.6? + .432? 2 . 

Por tanto, para la situacion (a) donde ? = 10, 

E[C a ( 10)] = 160 y £[C b (10)]= 159.2, 

resulta en la seleccion de la maquina B. 

Para la situacion (b), ? = 20 y 

£[C a ( 20)] = 380 y £[C B (20)] = 404.8, 

resultando en la seleccion de la maquina A. 

En conclusion, las maquinas de tipo B son mas economicas para periodos cortos por su 
menor costo de operacion por hora. No obstante, para periodos largos, las maquinas de tipo A 
son mas economicas porque tienden a ser reparadas con menos frecuencia. ■ 


El proposito de esta section fue introducir el concepto de un valor esperado y desarrollar 
algunos teoremas utiles para hallar medias y varianzas de variables aleatorias o funciones de 
variables aleatorias. En las secciones siguientes presentamos algunos tipos especfficos de varia¬ 
bles aleatorias discretas y damos formulas para sus distribuciones de probabilidad y sus medias 
y varianzas. Como vera, en realidad deducir algunos de estos valores esperados requiere de ex- 
periencia en la suma de series algebraicas y conocimiento de unos cuantos trucos. Ilustraremos 
algunos de ellos en varias de las deducciones de las secciones siguientes. 


Ejercicios 

3.12 Sea Y una variable aleatoria con p(y) dada en la tabla siguiente. Encuentre E(Y), E(l/Y), E(Y 2 - 1) 
y V(Y). 


y 

12 3 4 

p(y ) 

.4 .3 .2 .1 
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3.13 Consulte el juego de tiro al aire de una moneda del Ejercicio 3.2. Calcule la media y la varianza de F, 
que son sus ganancias en un solo intento. Observe que E(Y)> 0. ^Cuanto debe pagar usted por participar 
en este juego si sus ganancias netas , es decir, la diferencia entre pago y costo de jugar han de tener una 
media de 0? 

3.14 La vida maxima de la patente para un nuevo medicamento es 17 anos. Si restamos el tiempo requerido 
por la FDA para someter a pruebas y aprobar el medicamento, se obtiene la vida real de la patente para 
el medicamento, es decir, el tiempo que la companfa tiene para recuperar los costos de investigacion y 
desarrollo y para obtener una utilidad. La distribucion de los tiempos de vida reales de las patentes para 
nuevos medicamentos se da a continuation: 


Anos, y 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

p(y) 

.03 

.05 

.07 

.10 

.14 

.20 

.18 

.12 

.07 

.03 

.01 


a Encuentre la vida media de la patente para un nuevo medicamento. 

b Encuentre la desviacion estandar de Y = tiempo de vida de un nuevo medicamento seleccionado al 
azar. 

c ^Cual es la probabilidad de que el valor de Y caiga en el intervalo p. ± 2cr? 

3.15 ^Quien es el rey de los programas de TV por la noche? Una encuesta en Internet estima que, cuando se 
les da a elegir entre David Letterman y Jay Leno, 52% de la poblacion prefiere ver a Jay Leno. Al azar 
se seleccionan tres personas que ven TV hasta tarde y se les pregunta cual de los dos presentadores de 
programas prefieren. 

a Encuentre la distribucion de probabilidad para Y, el numero de personas de la muestra que prefieren 
a Leno. 

b Construya un histograma de probabilidad para p(y). 

c ^Cual es la probabilidad de que exactamente una de esas tres personas prefiera a Leno? 
d ^Cuales son la media y la desviacion estandar para F? 

e ^Cual es la probabilidad de que el numero de personas a favor de Leno caiga a no mas de 2 desvia- 
ciones estandar de la media? 

3.16 Al secretario del Ejercicio 2.121 se le dieron n contrasenas de computadora e intenta usarlas al azar. 
Exactamente una contrasena permitira el acceso a un archivo de computadora. Encuentre la media y la 
varianza de F, que es el numero de intentos necesarios para abrir el archivo, si se eliminan las contrase¬ 
nas no exitosas (como en el Ejercicio 2.121). 

3.17 Consulte el Ejercicio 3.7. Encuentre la media y la desviacion estandar para F = numero de tazones 
vaclos. ^Cual es la probabilidad de que el valor de F caiga a no mas de 2 desviaciones estandar de la 
media? 

3.18 Consulte el Ejercicio 3.8. ^.Cual es el numero medio de celulas de la segunda generation? 

3.19 Una compafua de seguros expide una poliza de un ano por $1000 dolares contra el suceso A que historica- 
mente le ocurre a 2 de cada 100 propietarios de la poliza. Las tarifas administrativas son de $15 por poliza 
y no son parte de la “utilidad’" de la compafua. ^Cuanto debe cobrar la compafua por la poliza si requiere 
que la utilidad esperada por poliza sea de $50? [Sugerencia: si C es la prima por la poliza, la “utilidad” de la 
companfa es C - 15 si A no ocurre y C - 15 - 1000 si A ocurre.] 

3.20 Una companfa manufacturera envfa su producto en camiones con remolques de dos tamanos diferentes. 
Cada embarque se hace en un remolque con dimensiones de 8 pies X 10 pies X 30 pies o de 8 pies X 10 
pies X 40 pies. Si 30% de sus envfos se hacen usando remolques de 30 pies y 70% en remolques de 40 
pies, encuentre el volumen medio enviado en cada remolque. (Suponga que los remolques siempre estan 
llenos.) 

3.21 El numero N de casas residenciales a las que una companfa de bomberos da servicio depende de la 
distancia r (en manzanas) que una motobomba puede alcanzar en un tiempo especificado (fijo). Si 
suponemos que N es proporcional al area de un cfrculo de R manzanas desde la estacion de bomberos. 
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3.22 

3.23 

3.24 

3.25 

*3.26 

3.27 

3.28 

*3.29 

3.30 


entonces N — CttR 2 , donde C es una constante, tt = 3.1416. . ., y R, la variable aleatoria, es el numero 
de manzanas que una motobomba se puede trasladar en el tiempo especificado. Para una companfa 
particular de bomberos, C = 8, la distribucion de probabilidad para R es como se muestra en la tabla 
siguiente y p(r) = 0 para r £ 20 y r a 27. 


r 

21 

22 

23 

24 

25 

26 

pin 

.05 

.20 

.30 

.25 

.15 

.05 


Encuentre el valor esperado de N, el numero de casas a las que el departamento de bomberos puede 
atender. 

Un dado balanceado se tira una vez. Sea Y el numero en su cara superior. Encuentre el valor esperado y 
la varianza de Y. 

En un juego de azar una persona saca una sola carta de una baraja ordinaria de 52 cartas. A una persona 
le pagan $15 por sacar una “sota” o una reina y $5 por sacar un rey o un as. Alguien que saque cualquier 
otra carta paga $4. Si una persona participa en este juego, ^,cual es la ganancia esperada? 

Aproximadamente 10% de las botellas de vidrio que salen de una lfnea de produccion presentan defec- 
tos serios en el vidrio. Si dos botellas se seleccionan al azar, encuentre la media y la varianza del numero 
de botellas que presentan defectos serios. 

Dos contratos de construction se van a asignar al azar a una o mas de tres empresas: I, II y III. Cualquier 
empresa puede recibir ambos contratos. Si cada contrato dara una utilidad de $90,000 para la empresa, 
encuentre la utilidad esperada para la empresa I. Si las empresas I y II son propiedad de la misma per¬ 
sona, ^cual es la utilidad esperada total del propietario? 

Un vendedor de equipo pesado puede comunicarse con uno o dos clientes por dla con probabilidades 1/3 
y 2/3, respectivamente. Cada contacto resultara ya sea en que no haya venta o en una venta de $50,000, 
con las probabilidades .9 y .1, respectivamente. Obtenga la distribucion de probabilidad para ventas al dla. 
Encuentre la media y la desviacion estandar de las ventas al dia. 3 

Un cliente potencial para una poliza de seguro contra incendio por $85,000 es propietario de una casa 
en una zona que, de acuerdo con la experiencia, puede sostener una perdida total en un ano determinado 
con probabilidad de .001 y un 50% de perdida con probabilidad .01. Si se ignoran todas las otras perdidas 
parciales, ^que prima debe cobrar la companfa de seguros por una poliza anual para que no haya perdida 
ni ganancia en todas las polizas de $85,000 en esta zona? 

Consulte el Ejercicio 3.3. Si el costo de probar un componente es $2 y el costo de reparar uno defectuoso 
es $4, encuentre el costo total esperado por probar y reparar el lote. 

Si Y es una variable aleatoria discreta que asigna probabilidades positivas a solo los enteros positivos, 
demuestre que 


OO 

E(Y) = J2 p ( ¥ -*)■ 

i =1 

Suponga que Y es una variable aleatoria discreta con media /jl y varianza a 2 y sea X = Y + 1. 
a ^Se espera que la media de X sea mayor, menor o igual que /l = £"(7)? i,Por que? 
b Use los Teoremas 3.3 y 3.5 para expresar E{X)= E{Y + 1) en terminos de /jl = E(Y). ^,Este resultado 
esta de acuerdo con la respuesta al inciso (a)? 

c Recordando que la varianza es una medida de dispersion, ^espera listed que la varianza de X sea 
mayor, menor o igual que a 2 = V{Y)1 ^Por que? 


3. Los ejercicios precedidos por un asterisco son opcionales. 
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d Use la Definicion 3.5 y el resultado del inciso b para demostrar que 

V{X) = E{[(X - E(X)f} = E[{Y - pi) 2 ] = o- 2 ; 
esto es, X = Y + 1 y Y tienen varianzas iguales. 

3.31 Suponga que Y es una variable aleatoria discreta con media /x y varianza cr 2 y sea W = 2Y. 

a ^Espera usted que la media de W sea mayor, menor o igual que /x = E{Y)1 ^Por que? 

b Use el Teorema 3.4 para expresar E{W)= E(2Y) en terminos de /x = £(50- x,Este resultado esta de 
acuerdo con la respuesta al inciso a? 

c Recordando que la varianza es una medida de dispersion, ^espera usted que la varianza de W sea 
mayor, menor o igual que a 2 = V(F)? ^Por que? 

d Use la Definicion 3.5 y el resultado del inciso b para demostrar que 

V{W) = E{[W - E{W)] 2 } = £[4(F - /x) 2 ] = 4o- 2 ; 
esto es, W = 2Y tiene una varianza que cuadriplica la de Y. 

3.32 Suponga que Y es una variable aleatoria discreta con media /x y varianza cr 2 y sea U = F/10. 

a ^Espera usted que la media de U sea mayor, menor o igual a /x = £(F)? ^Por que? 
b Use el Teorema 3.4 para expresar £((/)= E{Y/ 10) en terminos que /x = E{Y). ^Este resultado esta de 
acuerdo con la respuesta al inciso a? 

c Recordando que la varianza es una medida de dispersion, ^espera usted que la varianza de U sea 
mayor, menor o igual que cr 2 = V{Y)2 ^Por que? 
d Use la Definicion 3.5 y el resultado del inciso (b) para demostrar que 

V{U) = E{[U - E(U)] 2 } = £[.01<T - /x) 2 ] = .Olcr 2 ; 
esto es, U = F/10 tiene varianza .01 veces la de F. 

3.33 Sea Funa variable aleatoria discreta con media /x y varianza cr 2 . Si a y b son constantes, use los Teoremas 
3.3 y 3.6 para demostrar que 

a E(aY + b) = aE(Y) + b = c;/x + b, 
b V(aY +b) = a 2 V(Y) = a 2 a 2 . 

3.34 El gerente del almacen de una fabrica ha construido la siguiente distribucion de probabilidad para la 
demanda diaria (numero de veces que se usa) de una herramienta en particular. 


y 

0 

1 2 

p(y) 

,i 

.5 .4 


Cuesta a la fabrica $10 cada vez que la herramienta se usa. Encuentre la media y la varianza del costo 
diario por usar la herramienta. 


3.4 La distribucion de probabilidad binomial 

Algunos experimentos consisten en la observacion de una secuencia de intentos identicos e 
independientes, cada uno de los cuales puede resultar en una de dos salidas. Cada artfculo que 
sale de la lfnea de produccion de manufacturas es defectuoso o no defectuoso. Cada disparo en 
una secuencia de tiros a un bianco puede resultar en un acierto o en no acierto y cada una de 
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las n personas entrevistadas antes de una election local esta a favor del candidato Jones o no 
lo esta. En esta section estamos interesados en experimentos, conocidos como experimentos 
binomiales, que presentan las siguientes caracterfsticas. 


DEFINICION 3.6 Un experimento binomial presenta las siguientes propiedades: 

1. Consiste en un numero fijo, n, de pruebas identicas. 

2. Cada prueba resulta en uno de dos resultados: exito, S, o fracaso, F. 

3. La probabilidad de exito en una sola prueba es igual a algun valor p y es el mismo 
de una prueba a la otra. La probabilidad de fracaso es igual a q = (1 — p). 

4. Las pruebas son independientes. 

5. La variable aleatoria de interes es Y, el numero de exitos observado durante las n 
pruebas. 


Determinar si un experimento particular es binomial requiere examinar el experimento en bus- 
ca de cada una de las caracterfsticas recien enlistadas. Observe que la variable aleatoria de interes 
es el numero de exitos observado en las n pruebas. Es importante ver que un exito no es necesaria- 
mente “bueno” en el sentido diario de la palabra. En nuestras exposiciones, exito es simplemente 
un nombre para uno de los dos posibles resultados en una sola prueba de un experimento. 


EJEMPLO 3.5 Un sistema de detection de alarma temprana para aviones consta de cuatro unidades de ra¬ 
dar identicas que operan de manera independiente entre si. Suponga que cada una tiene una 
probabilidad de .95 de detectar un avion intruso. Cuando un avion intruso entra en escena, la 
variable aleatoria de interes es Y, el numero de unidades de radar que no detecta el avion. ^Es 
este un experimento binomial? 

Solution Para decidir si este es un experimento binomial, debemos determinar si cada uno de los cinco 
requisitos de la Definicidn 3.6 se satisface. Observe que la variable aleatoria de interes Y, es 
el numero de unidades de radar que no detecta un avion. La variable aleatoria de interes en 
un experimento binomial es siempre el numero de exitos; en consecuencia, este experimento 
puede ser binomial solo si llamamos exito al evento de no detectar. Ahora examinemos el 
experimento en cuanto a las cinco caracterfsticas del experimento binomial. 


1. El experimento comprende cuatro pruebas identicas; cada una de ellas consiste en de¬ 
terminar si una unidad particular de radar detecta (o no) el avion. 

2. Cada prueba arroja uno de dos resultados. Como la variable aleatoria de interes es el 
numero de exitos, S denota que el avion no fue detectado y F denota que fue detec- 
tado. 

3. Como todas las unidades de radar detectan el avion con igual probabilidad, la probabi¬ 
lidad de una S en cada prueba es la misma y p = P(S) = P (no detectar) = .05. 
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4. Las pruebas son independientes porque las unidades operan de manera independiente. 

5. La variable aleatoria de interes es Y. el numero de exitos en cuatro pruebas. 

Entonces, el experimento es binomial con n = 4, p = .05 y q = 1 - .05 = .95. ■ 


EJEMPLO 3.6 Suponga que 40% de una poblacion grande de votantes registrados esta a favor del candidate 
Jones. Una muestra aleatoria de n = 10 votantes sera seleccionada y se ha de observar Y, el 
numero de quienes estan a favor de Jones. <',LI experimento satisface los requisitos de un ex¬ 
perimento binomial? 

Solution Si cada una de las diez personas se selecciona al azar de entre la poblacion, entonces tenemos 
diez pruebas casi identicas con cada prueba resultando en una persona que esta a favor de Jones 
(, S ) o no esta a favor de Jones (/-'). La variable aleatoria de interes es entonces el numero de exi¬ 
tos en las diez pruebas. Para la primera persona seleccionada, la probabilidad de estar a favor 
de Jones ( S ) es .4. Pero, ^que se puede decir acerca de la probabilidad biconditional de que la 
segunda persona este a favor de Jones? En el Ejercicio 3.35 se demostrara que la probabilidad 
inconditional de que la segunda persona este a favor de Jones tambien es .4. Entonces, la pro¬ 
babilidad de un exito S sigue siendo la misma de una prueba a otra. No obstante, la probabili¬ 
dad conditional de un exito en pruebas posteriores depende del numero de exitos en las prue¬ 
bas previas. Si la poblacion de electores es grande, eliminar una persona no cambia en forma 
importante la fraction de electores que estan a favor de Jones y la probabilidad conditional de 
que la segunda persona este a favor de Jones sera muy cercana a .4. En general, si la poblacion 
es grande y el tamano muestral es relativamente pequeno, la probabilidad conditional de exito 
en una prueba posterior dado el numero de exitos en las pruebas previas seguira siendo mas 
o menos igual cualesquiera que sean los resultados en pruebas previas. Por tanto, las pruebas 
seran aproximadamente independientes y entonces los problemas de muestreo de este tipo son 
aproximadamente binomiales. ■ 


Si el tamano muestral del Ejemplo 3.6 fue grande con respecto al tamano poblacional (por 
ejemplo 10% de la poblacion), la probabilidad conditional de seleccionar un partidario de 
Jones en una election posterior sera alterada de manera importante por las preferencias de las 
personas seleccionadas antes en el experimento y este no serfa binomial. La distribucion de 
probabilidad hipergeometrica, tema de la Section 3.7, es el modelo apropiado de probabilidad a 
usarse cuando el tamano muestral es grande con respecto al tamano poblacional. 

Usted puede refinar su capacidad de identificar experimentos binomiales si reexamina los 
ejercicios del final del Capftulo 2. Varios de los experimentos en esos ejercicios son experi¬ 
mentos binomiales o aproximadamente binomiales. 

La distribucion ply) de probabilidad binomial se puede deducir al aplicar el metodo de pun- 
to muestral para hallar la probabilidad de que el experimento produzca y exitos. Cada punto 
muestral del espacio muestral puede estar caracterizado por un multiplo n (rearreglo) que con- 



3.4 La distribucion de probabilidad binomial 103 


DEFINICION 3.7 


tiene las letras S y F, correspondientes a exito y fracaso. Un punto muestral tfpico aparecerfa 
entonces como 

SSFSFFFSFS... FS, 

_ _ ✓ 

n posiciones 

donde la letra en la /-esima posicion (de izquierda a derecha) indica el resultado de la /esima 
prueba. 

Consideremos ahora un punto muestral particular correspondiente a y exitos y por tanto 
contenido en el evento numerico Y = y. Este punto muestral, 

SSSSS ... SSS FFF ... FF , 

V -V-' V -v-' 

y n—y 

representa la interseccion de n eventos independientes (los resultados de las n pruebas), en 
las que hubo y exitos seguidos por in - y) fracasos. Como las pruebas fueron independientes 
y la probabilidad de S, p, sigue igual de una prueba a otra, la probabilidad de este punto 
muestral es 

ppppp- ■ -ppp qqq-- -qq = p y q n ~ y - 

terminos y terminos n - y 

Cada uno de los puntos muestrales del evento Y = y se puede representar como un rearreglo 
que contenga un numero y de exitos S y (n - y) fracasos. Cualquier punto muestral tambien 
tiene probabilidad p y q n ~ y . Como el numero de arreglos que contienen la cantidad y de exitos S 
y de (n - y ) fracasos F es (del Teorema 2.3) 

/ n\ n\ 

\yj y!(« — y)! ’ 

se deduce que el evento (F = v) esta formado por (") puntos muestrales, cada uno con proba¬ 
bilidad />V/ ,rv , y que p(y) = (")p y q n ~ y , y =0, 1, 2, n. El resultado que hemos deducido 
es la formula para la distribucion de probabilidad binomial. 


Se dice que una variable aleatoria Y tiene una distribucion binomial basada en n pruebas 
con probabilidad p de exito si y solo si 

p(y) = r J P y q n ~ y , y =0, 1,2,..., n y 0 < p < 1. 


La Figura 3.4 representa p(y) graficamente como histogramas de probabilidad, el primero 
para n = 10, p = . 1; el segundo para n = 10, p = .5; y el tercero para n = 20, p = .5. Antes de 
continuar, reconsideremos la representacion para los puntos muestrales de este experimento. 
Hemos visto que un punto muestral puede estar representado por una secuencia de n letras, 
cada una de las cuales es S o F. Si el punto muestral contiene exactamente una S, la proba¬ 
bilidad asociada con ese punto muestral es pq"~ l . Si otro punto muestral contiene 2 letras 
S y (n - 2) letras F la probabilidad de este punto muestral es p 2 q n ~ 2 . Observe que los puntos 
muestrales para un experimento binomial no son equiparables a menos quep = .5. 

El termino experimento binomial se deriva del hecho de que cada prueba arroja uno de 
clos posibles resultados y de que las probabilidades p(y), y = 0, 1 , 2, ... ,n, son terminos de la 
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FIGURA 3.4 
Histogramas 
de probabilidad 
binomial 
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(c) 


expansion binomial 


(<7 + P) n 



+ 



+ • • • + 



Se observaque(g)g n = p(0), (”)/?’ q n ~ x = p{\) y, en general, p(y) = C'^p y q n ~ y - Tambien 
se cumple que p(y ) satisface las propiedades necesarias para una funcion de probabilidad por- 
que p(y) es positiva para y = 0, 1,..., n y [porque (q + p) = 1 ] 


’) = J2 


v—0 


p y q n y = 


(q + p) n = 1" = 1. 
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La distribucion de probabilidad binomial tiene muchas aplicaciones porque el experimento 
binomial se presenta al muestrear defectos en control de calidad industrial, en el muestreo de 
preferencia de los consumidores o en poblaciones de votantes y en muchas otras situaciones 
ffsicas. llustraremos con algunos ejemplos. Otros modelos practicos apareceran en los ejerci- 
cios al final de esta seccion y tambien al final del capftulo. 


EJEMPLO 3.7 Suponga que un lote de 5000 fusibles electricos contiene 5% de piezas defectuosas. Si se 
prueba una muestra de 5 fusibles, encuentre la probabilidad de hallar al menos uno defec- 
tuoso. 


Solucion Es razonable suponer que Y, el numero observado de defectuosos, tiene una distribucion bi¬ 
nomial aproximada porque el lote es grande. Retirar unos cuantos fusibles no cambia lo sufi- 
ciente la composicion de los restantes como para preocuparnos. Entonces, 


/-'(al menos uno defectuoso) 


p( o) = i - Q A 5 


= 1 - (.95) 5 = 1 - .11A = .226. 


Observe que hay una probabilidad mas bien grande de ver al menos uno defectuoso, aun cuan- 
do la muestra sea muy pequena. ■ 


EJEMPL0 3.8 La experiencia ha demostrado que 30% de todas las personas afectadas por cierta enfermedad 
se recuperan. Una empresa fabricante de medicamentos ha inventado una nueva medicina. Diez 
personas con la enfermedad se seleccionaron al azar y recibieron la medicina; nueve se recupe- 
raron al poco tiempo. Suponga que la medicina no es eficaz en absoluto. <,Cual es la probabili¬ 
dad de que se recuperen al menos nueve de entre diez que recibieron la medicina? 

Solucion Denote con Y el numero de personas que se recuperan. Si la medicina no funciona, la probabi¬ 
lidad de que una sola persona enferma se recupere es p = .3. Entonces el numero de pruebas 
es n = 10 y la probabilidad de que exactamente nueve se recuperen es 


P(Y = 9) = p{ 9) 



(,3) 9 (.7) 


.000138. 


Del mismo modo, la probabilidad de que exactamente diez se recuperen es 


y 


P(Y = 10) = p( 10) 



(.3) 10 (.7)° = .000006, 


P(Y > 9) = p( 9) + p( 10) = .000138 + .000006 = .000144. 

Si la medicina no es eficaz, la probabilidad de observar al menos nueve que se recuperen es 
sumamente pequena. Si administramos la medicina a diez personas y observamos que al menos 
nueve se recuperan, entonces (1) la medicina no sirve y hemos observado un evento raro o bien 
(2) la medicina es en verdad util para curar la enfermedad. Nos apegamos a la conclusion 2. 
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Una tabulacion de probabilidades binomiales de la forma o P(y)> presentada en la 
Tabla 1, Apendice 3, reducira en gran medida los calculos para algunos de los ejercicios. Las 
obras de consulta que aparecen al final del capftulo citan varias tabulaciones mas amplias de 
probabilidades binomiales. Debido a limitaciones practicas de espacio, las tablas impresas 
por lo general se aplican solo a valores seleccionados de n y p. Las probabilidades binomiales 
tambien se pueden hallar con el uso de varios paquetes de software. Si Y tiene una distribu¬ 
tion binomial basada en n intentos con probabilidad de exito P, P(Y = yo) = p(yo) se 
puede hallar con el comando dbinom( y () , n, p), mientras que P(Y < y 0 ) se encuentra con 
el comando pbinom (yo, n, p) de R (o S-Plus). Una ventaja distintiva de usar software para 
calcular probabilidades binomiales es que practicamente se pueden usar cualesquiera valores 
de n y p. llustramos el uso de la Tabla 1 (y, de manera simultanea, el uso de la salida del co¬ 
mando R pbinom (y 0 , n, p)) en el siguiente ejemplo. 


EJEMPLO 3.9 Se supone que el voluminoso lote de fusibles electricos del Ejemplo 3.7 contiene solo 5% de de- 
fectuosos. Si n = 20 fusibles se muestrean al azar de este lote, encuentre la probabilidad de que se 
observen al menos cuatro defectuosos. 

Solution Si se denota con Y el numero de defectuosos de la muestra, suponemos el modelo binomial 
para Y, con p = .05. Entonces, 


P(Y > 4) = 1 - P(Y < 3), 

y usando la Tabla 1, Apendice 3 [o el comando pbinom ( 3,20, . 05 ) ]de R, obtenemos 

3 

P(Y <3) = J^p(y) = .984. 

y=0 


El valor .984 se encuentra en la tabla marcada n = 20 en la Tabla 1, Apendice 3. Especfficamente, 
aparece en la columna marcada p = .05 y en la fila marcada a = 3. Se deduce que 

P(Y >4) = 1 - .984 = .016. 

Esta probabilidad es muy pequena. Si en realidad observamos mas de tres defectuosos de en- 
tre 20 fusibles, podrfamos sospechar que el porcentaje reportado de 5% es erroneo. ■ 


La media y la varianza asociadas con una variable aleatoria binomial se deducen en el 
siguiente teorema. Como veremos en la prueba del teorema, es necesario evaluar la suma de 
algunas series aritmeticas. En el curso de la prueba ilustramos algunas de las tecnicas que 
existen para sumar esas series. En particular, usamos el hecho de que ]U. p(y) = 1 para cual- 
quier variable aleatoria discreta. 
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TEOREMA 3.7 


Demostracion 


Sea Y una variable aleatoria binomial basada en n pruebas y probabilidad p de exito. 
Entonces 

p = E(Y) = np y er 2 = V(Y) = npq. 

Por las Definiciones 3.4 y 3.7, 


E (Y) =J2yp(y) = y - 

Observe que el primer termino de la suma es 0 y, por tanto, que 


e(Y) = E- v ;- 

(n-y)\y\ 


= E 

,V=1 


(n — y)!(v - 1)! 


P y q n ~ y . 


Los sumandos de esta ultima expresion presentan un sorprendente parecido con las 
probabilidades binomiales. De hecho, si factorizamos np en cada termino de la suma y 
hacemos z = y~ 1, 


!)• y —1 n-y 

E(Y) = np ^ - —<P 9 


y : 

n —1 


i (n ~ v)!(y - 1)! 


3 n-l-z 

— np y - pq 

(n - l - zV.zV 


= n P E 


z=0 


n — 1 


p z q"~ x ~ z . 


Observe que p(z) = (" _ )p z q" 1 ' es la funcion de probabilidad binomial basada en 
(n -1) pruebas. Asi, V p(z) = 1 y se deduce que 

p = E(Y) = np. 

Del Teorema 3.6 sabemos que cr 2 = V(Y) = E(Y 2 ) - p 2 . Entonces, cr 2 se puede calcular 
si hallamos E(Y 2 ). Hallar E(Y 2 ) directamente es dificil porque 


E(Y 2 ) = J2y 2 p(y) = J2y 2 ( n )p y q"- y = £.V 


y= o 


y=0 


n ! 


y=0 


y'Xn - y)l 


p y q"-y 


y la cantidad y no aparece como factor de y\. ^Hacia donde vamos ahora? Observe que 


E[Y(Y - 1)] = E(Y 2 - Y) = E(Y 2 ) - E(Y) 

y, por tanto, 

E(Y 2 ) = E[Y(Y - 1)] + E(Y) = E[Y(Y - 1)] + p. 
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En este caso, 


E[Y(Y- 1)] = 


y =o 


y!(n - y)\ 


p y q"~ y . 


Los terminos primero y segundo de esta suma son iguales a cero (cuando y = 0 y y = 
1). Entonces 


n ! 

E[Y(Y -l)] = J2 -—- 77 P y q"- y . 

pj (y -2 )!(« - y)\ 

(Observe la cancelacion que llevo a este ultimo resultado. La anticipacion de esta can- 
celacion es lo que en realidad motivo la consideration de E[Y(Y — 1)].) De nuevo, los 
sumandos de la ultima expresion se asemejan mucho a probabilidades binomiales. 
Factorice n(n - I )/r en cada termino de la suma y sea z = y~ 2 para obtener 


E[Y(Y- 1)] 


«(" ■ vp 2 it, .. m p y 2 < i n y 


y= 2 

n-2 




n(n - 1 )p 2 _} n ^ _^ p z q n 2 z 


z=0 


z\(n - 2 - z)! J 


n— 2 

i(n - 1 ) p 2 

z=0 


n — 2 

z 


p z q n - 2 ~ z . 


De nuevo observe que p{z) = ("- 2 )P z q" 2 z es la funcion de probabilidad binomial 
basada en (n - 2) pruebas. Asf p(z) = 1 (de nuevo usando el dispositivo ilustrado 
en la obtencion de la media) y 

E[Y(Y - 1)] = n(n - 1 )p 2 . 

Entonces, 

E{Y 2 ) = E[Y{Y - 1)] + n = n(n - 1 )p 2 + np 


y 


o- 2 = E(Y 2 ) ~ p 2 = n{n - 1 )p 2 + np - n 2 p 2 
= np[(n — 1 )p + 1 — np] = np( 1 — p) = npq. 


Ademas de proporcionar las formulas para la media y la varianza de una variable aleatoria 
binomial, la deduccion del Teorema 3.7 ilustra el uso de dos de los trucos mas comunes, por 
ejemplo, usar el hecho de que ^Zp(y) = 1 si p(y) es una funcion de probabilidad valida y ha- 
llar E(Y 2 ) para determinar E[Y(Y - 1)]. Estas tecnicas tambien seran utiles en las secciones 
siguientes donde consideramos otras distribuciones de probabilidad discreta y las medias y 
varianzas asociadas. 

Una fuente de error frecuente al aplicar la distribucion de probabilidad binomial a problemas 
practicos es no definir cual de los dos posibles resultados de una prueba es el exitoso. Como 
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consecuencia de ello, q puede usarse erroneamente en lugar de p. Defina con todo cuidado un 
exito y asegurese de que p sea igual a la probabilidad de un exito para cada aplicacion. 

Hasta aqui en esta seccion hemos supuesto que el numero de pruebas, n, y la probabilidad 
de exito, p, se conocian y usamos la formula p(y) = (' , )p y q n ~ y para calcular probabilidades 
asociadas con variables aleatorias binomiales. En el Ejemplo 3.8 obtuvimos un valor para 
P(Y > 9) y usamos esta probabilidad para llegar a una conclusion acerca de la efectividad del 
medicamento. El siguiente ejemplo exhibe otro uso estadistico, mas que probabilistico, de la 
distribucion binomial. 


EJEMPLO 3.10 Suponga que se hace una encuesta a 20 personas que trabajan para una gran empresa y se les 
pregunta a cada uno si estan a favor de la implantacion de una nueva politica respecto de 
los fondos de jubilacion. Si en nuestra muestra, 6 estan a favor de la nueva politica, encuentre 
una estimacion de p, la verdadera pero desconocida proporcion de empleados que estan a 
favor de la nueva politica. 

Solucion Si Y denota el numero entre los 20 que estan a favor de la nueva politica, es razonable concluir 
que Y tiene una distribucion binomial con n = 20 para algun valor de p. Cualquiera que sea el 
verdadero valor de p, concluimos que la probabilidad de observar 6 de entre 20 a favor de la 
politica es 


P(Y=6)= ( 2 6 °)A1-P) 14 - 

Usaremos como nuestra estimacion para p el valor que maximice la probabilidad de obser¬ 
var el valor que realmente observamos (6 a favor en 20 pruebas). /.Como encontramos el valor 
de p que maximice P(Y = 6)? 

Como ( 2 6 °) es una constante (respecto de p) y ln(w) es una funcion creciente de w, el va¬ 
lor de p que maximiza P(Y = 6) = ( 2 6 °)/? 6 (l — p ) 14 es igual al valor de p que maximiza 
ln[/? 6 (l — /?) 14 ] = [61n(/?) + 14 ln( 1 — /?)]. 

Si evaluamos la derivada de [6 \n(p) +14 ln(l - /?)] con respecto a p, obtenemos 

d[6\n(p) + 14ln( 1 — /?)] /6\ / 14 \ 

dp V/V V1-/V 

El valor de p que maximiza (o minimiza) [6 ln(p) +14 ln(l — p)][y, lo que es mas importante, 
p( Y = 6)] es la solucion de la ecuacion 


6 

P 



= 0 . 


Resolviendo, obtenemos/? = 6/20. 

Como la segunda derivada de [6 ln(/?) + 14 ln( 1 - /?)] es negativa cuando p = 6/20, se 
deduce que [6 ln(/?) + 14 ln(l - /?)][y P(Y = 6)] se maximiza cuando p = 6/20. Nuestra 
estimacion para p, basada en 6 “exitos” entre 20 pruebas es por tanto 6/20. 

La respuesta final que obtuvimos debe parecer bastante razonable. Como p es la probabili¬ 
dad de un “exito” en cualquier prueba determinada, una estimacion razonable es, en realidad, 
la proporcion de “exitos” en nuestra muestra, en este caso 6/20. En la siguiente seccion apli- 
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caremos esta misma tecnica para obtener una estimacion que no es inicialmente tan intuitiva. 
Como veremos en el Capftulo 9, la estimacion que acabamos de obtener es la estimacion de 
maxima probabilidad para p y el procedimiento empleado lfneas antes es un ejemplo de la 
aplicacion del metodo de maxima probabilidad. M 


Ejercicios 

3.35 Considere la poblacion de electores descrita en el Ejemplo 3.6. Suponga que hay N = 5000 electores 
en la poblacion, 40% de los cuales estan a favor de Jones. Identifique el evento estd a favor de Jones 
como el exito S. Es evidente que la probabilidad de S en el intento 1 es .40. Considere el evento B de 
que S suceda en la segunda prueba. Entonces B puede ocurrir en dos formas: las primeras dos pruebas 
son exitosas o bien la primera prueba es un fracaso y la segunda es un exito. Demuestre que P(B) = .4. 
^Cual es P(B |la primera prueba es S)7 ^,Esta probabilidad conditional difiere marcadamente de P(B)7 

3.36 a Un meteorologo en Denver registro Y = el numero de dias de lluvia durante un periodo de 30 dfas. 

^Tiene Y una distribucion binomial? Si es asf, ^se dan los valores de n y p7 

b Una empresa de investigation de mercado ha contratado operadoras para que realicen encuestas por 
telefono. Se usa una computadora para marcar al azar un numero telefonico y la operadora pregunta 
a la persona que contesta si tiene tienipo para responder unas preguntas. Sea Y = el numero de 11a- 
madas hechas hasta que la primera persona contesta que esta dispuesta a responder las preguntas. 
^Es este un experimento binomial? Explique. 

3.37 En 2003, el promedio de calificacion combinada del examen Scholastic Aptitude Test (SAT) (matematicas 
y verbal) para estudiantes que van a la universidad en Estados Unidos fue 1026. Suponga que aproximada- 
mente 45% de todos los graduados de preparatoria hizo este examen y que 100 egresados de preparatoria 
se seleccionan al azar de entre todos los egresados en Estados Unidos. De las siguientes variables aleato¬ 
rias, ^,cual tiene una distribucion que puede ser aproximada por una distribucion binomial? Siempre que 
sea posible, de los valores para n y p. 

a El numero de estudiantes que hizo el SAT 
b Las calificaciones de los 100 estudiantes de la muestra 

c El numero de estudiantes de la muestra que obtuvo calificaciones arriba del promedio del SAT 
d El tiempo necesario para que cada estudiante terminara el SAT 
e El numero de egresadas (mujeres) de preparatoria de la muestra 

3.38 El fabricante de una bebida lactea de bajo contenido de calortas desea comparar el atractivo del gusto de 
una nueva formula (formula B) con el de la formula estandar (formula A). A cada uno de cuatro jueces 
se les dan tres vasos en orden aleatorio, dos de ellos cont la formula A y el otro con la formula B. A cada 
uno de los jueces se les pide indicar cual vaso fue el que disfruto mas. Suponga que las dos formulas son 
igualmente atractivas. Sea Y el numero de jueces que indican una preferencia por la nueva formula. 

a Encuentre la funcion de probabilidad para Y. 

b ^,Cual es la probabilidad de que al menos tres de los cuatro jueces indique una preferencia por la 
nueva formula? 

c Encuentre el valor esperado de Y. 
d Encuentre la varianza de Y. 
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3.39 Se construye un complejo sistema electronico con cierto numero de piezas de respaldo en sus subsiste- 
mas. Un subsistema tiene cuatro componentes identicos, cada uno con una probabilidad de .2 de fallar 
en menos de 1000 horas. El subsistema va a operar si dos de los cuatro componentes estan operando. 
Suponga que los componentes operan de manera independiente. Encuentre la probabilidad de que 

a exactamente dos de los cuatro componentes dure mas de 1000 horas, 
b el subsistema opere mas de 1000 horas. 

3.40 La probabilidad de que un paciente se recupere de una enfermedad estomacal es .8. Suponga que se sabe 
que 20 personas han contrafdo la enfermedad. ^Cual es la probabilidad de que 

a exactamente 14 se recuperen?, 
b al menos 10 se recuperen?, 
c al menos 14 pero no mas de 18 se recuperen?, 
d a lo sumo 16 se recuperen? 

3.41 Un examen de option multiple tiene 15 preguntas, cada una con cinco posibles respuestas, solo una de 
las cuales es correcta. Suponga que uno de los estudiantes que hace el examen contesta cada una de las 
preguntas con una adivinacion aleatoria independiente. ^Cual es la probabilidad de que conteste correc¬ 
tamente al menos diez preguntas? 

3.42 Consulte el Ejercicio 3.41. ^Cual es la probabilidad de que un estudiante conteste correctamente al me¬ 
nos diez preguntas si 

a para cada pregunta, el estudiante puede eliminar correctamente una de las respuestas equivocadas y 
contesta a continuation cada una de las preguntas con una adivinacion aleatoria independiente entre 
las respuestas restantes?, 

b puede eliminar correctamente dos respuestas equivocadas para cada pregunta y al azar selecciona de 
entre las respuestas restantes? 

3.43 Muchas empresas que generan energfa electrica promueven el ahorro de energla, para lo cual ofrecen 
tarifas de descuento a consumidores que mantengan su uso por debajo de ciertos estandares establecidos 
de subsidio. Un reciente informe de la EPA (agencia de protection ambiental observa que 70% de los 
residentes en Puerto Rico han reducido su consumo de electricidad lo suficiente para tener derecho a 
tarifas de descuento. Si se seleccionan al azar cinco suscriptores residenciales de San Juan, Puerto Rico, 
encuentre la probabilidad de cada uno de los siguientes eventos: 

a Los cinco tienen derecho a las tarifas favorables, 
b Al menos cuatro tienen derecho a tarifas favorables, 

3.44 Un nuevo procedimiento quirurgico es exitoso con una probabilidad de p. Suponga que la operation se 
realiza cinco veces y los resultados son independientes entre si. ^Cual es la probabilidad de que 

a todas las operaciones sean exitosas si p — .8? 
b exactamente cuatro sean exitosas si p = .6? 
c menos de dos sean exitosas si p = .3? 

3.45 Un aparato detector de incendios utiliza tres celdas sensibles a la temperatura que actuan de manera 
independiente una de otra, en forma tal que una o mas pueden activar la alarma. Cada celda presenta una 
probabilidad de p = .8 de activar la alarma cuando la temperature alcanza 100°C o mas. Sea Y igual al 
numero de celdas que activan la alarma cuando la temperature alcanza los 100°. 

a Encuentre la distribution de probabilidad para Y. 

b Encuentre la probabilidad de que la alarma funcione cuando la temperatura alcance los 100°. 
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3.46 Construya histogramas de probabilidad para las distribuciones de probabilidad binomiales para n = .5, 
p — ■ 1, .5 y .9. (La Tabla 1, Apendice 3, reducira la cantidad de calculos.) Notese la simetrfa para p — .5 
y la direction del sesgo para p = .1 y .9. 

3.47 Use la Tabla 1, Apendice 3, para construir un histograma de probabilidad para la distribution de proba¬ 
bilidad binomial para n = 20 y p = .5. Observe que casi toda la probabilidad cae en el intervalo 5 £ y 
< 15. 

3.48 Un sistema de protection contra proyectiles esta formado por n aparatos de radar que operan de manera 
independiente, cada uno con una probabilidad de .9 de detectar un proyectil que penetre en una zona que 
esta cubierta por todas las unidades. 

a Si n = 5 y un proyectil entra en la zona, ^cual es la probabilidad de que exactamente cuatro aparatos 
io detecten? ^A1 menos un aparato? 

b (,Que tan grande debe ser n si requerimos que la probabilidad de detectar un proyectil que entre en 
la zona sea .999? 

3.49 Un fabricante de cera para pisos ha creado dos nuevas marcas. Ay B, que desea someter a evaluation 
de propietarios de casas para determinar cual de las dos es superior. Ambas ceras, A y B, se aplican a 
superficies de pisos en cada una de 15 casas. Suponga que en realidad no hay diferencia en la calidad de 
las marcas. ^Cual es la probabilidad de que diez o mas propietarios de casas expresen preferencia por 

a lamarcaA?, 

b ya sea la marca A o la marca fi? 

3.50 En el Ejercicio 2.151 consideramos un modelo para la Serie Mundial de Beisbol. Dos equipos Ay B 
juegan una serie de partidos hasta que un equipo gane cuatro de ellos. Suponemos que los partidos 
se juegan de manera independiente y que la probabilidad de que A gane cualquier partido es p. Calcule la 
probabilidad de que la serie dure exactamente cinco partidos. [Sugerencia: use lo que sepa acerca de 
la variable aleatoria, T, el numero de partidos que A gane entre los primeros cuatro partidos.] 

3.51 En el siglo xvm, Chevalier de Mere pidio a Blaise Pascal comparar las probabilidades de dos eventos. A 
continuation, usted va a calcular la probabilidad de los dos eventos que, antes de una experiencia contraria 
en juegos, eran considerados por de Mere corno igualmente probables. 

a ^Cual es la probabilidad de obtener al menos un 6 en cuatro tiros de un dado sin cargar? 

b Si un par de dados sin cargar se lanza 24 veces en una mesa, ^cual es la probabilidad de que saiga al 
menos un doble seis? 

3.52 La prueba de gusto para la PTC (feniltiocarbamida) es un ejercicio favorito en grupos de estudiantes 
principiantes de genetica hurnana. Se ha establecido que un solo gen determina si un individuo es un 
"probador” o no lo es. Si 70% de norteamericanos son “probadores” y 20 de ellos se seleccionan al azar, 
^cual es la probabilidad de que 

a al menos 17 sean “probadores”?, 
b menos de 15 sean “probadores”? 

3.53 La enfermedad de Tay-Sachs es una afeccion genetica que suele ser mortal en ninos. Si ambos padres 
son portadores de la enfermedad, la probabilidad de que sus hijos desarrollen la enfermedad es aproxi- 
madamente .25. Suponga que un esposo y esposa son portadores y que tienen tres hijos. Si los resultados 
de los tres embarazos son mutuamente independientes, ^cuales son las probabilidades de los siguientes 
eventos? 

a Los tres hijos desarrollan la enfermedad. 
b Solo uno de los hijos desarrolla la enfermedad. 

c El tercer hijo desarrolla la enfermedad, dado que los primeros dos no la desarrollaron. 
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3.54 Suponga que Y es una variable aleatoria binomial basada en n intentos con probabilidad p de exito y 
considere Y* = n~ Y. 

a Demuestre que para y* — 0,2,... ,n 

P(Y * = y) = P(n- Y*= y*) = P(Y = n - Y*) 
b Use el resultado del inciso a para demostrar que 

P(Y* = r) = = (;),>>- 

c El resultado del inciso b implica que Y * tiene una distribution binomial basada en n pruebas y pro¬ 
babilidad de “exito” p* = q = 1 — p. i Por que este resultado es “obvio”? 

3.55 Suponga que Y es una variable aleatoria binomial con n > 2 pruebas y una probabilidad p de exito. Use 
la tecnica presentada en el Teorema 3.7 y el hecho de que E{ Y(Y- 1)(F- 2)} = E(Y 3 ) - 3E(Y 2 ) + 2E(Y) 
para deducir E{Y 3 ). 

3.56 Una empresa de exploracion petrolera se forma con suficiente capital para financiar diez exploraciones. La 
probabilidad de que una exploracion particular sea exitosa es .1. Suponga que las exploraciones son indepen- 
dientes. Encuentre la media y la varianza del numero de exploraciones exitosas. 

3.57 Consulte el Ejercicio 3.56. Suponga que la empresa tiene un costo fijo de $20,000 por preparar equipo 
antes de hacer su primera exploracion. Si cada exploracion exitosa cuesta $30,000 y cada una no exitosa 
cuesta $15,000, encuentre el costo esperado total para la empresa por sus diez exploraciones. 

3.58 Una venta particular comprende cuatro artfculos seleccionados al azar de un lote voluminoso que se 
sabe contiene 10% de artfculos defectuosos. Denote con Y el numero de los defectuosos entre los cuatro 
vendidos. El comprador de los artfculos devolvera los defectuosos para su reparation y el costo de esta 
esta dado por C = 3F 2 + Y + 2. Encuentre el costo de reparation esperado. [Sugerencia: el resultado 
del Teorema 3.6 implica que, para cualquier variable aleatoria Y, E(Y 2 ) = cr 2 + p, 1 .] 

3.59 Diez motores se empacan para su venta en cierto almacen. Los motores se venden en $100 cada uno, 
pero una garantfa de devolution del doble de su dinero es efectiva por cualquier unidad defectuosa que 
el comprador pueda recibir. Encuentre la ganancia neta esperada para el vendedor si la probabilidad de 
que cualquier motor sea defectuoso es .08. (Suponga que la calidad de cualquier motor es independiente 
de la de los otros.) 

3.60 Una concentration particular de un producto qufmico detectado en agua contaminada se encuentra que 
es letal para 20% de los peces que queden expuestos a la concentration durante 24 horas. Veinte peces 
se colocan en un tanque que contiene esta concentration del producto qufmico en agua. 

a Encuentre la probabilidad de que exactamente 14 sobrevivan. 
b Encuentre la probabilidad de que al menos 10 sobrevivan. 
c Encuentre la probabilidad de que a lo sumo 16 sobrevivan. 
d Encuentre la media y la varianza del numero que sobrevive. 

3.61 De los donadores voluntaries de sangre en una clfnica, 80% presentan factor Rhesus (Rh) en su sangre. 

a Si cinco voluntaries se seleccionan al azar, ^cual es la probabilidad de que al menos uno no presente 
el factor Rh? 

b Si cinco voluntaries se seleccionan al azar, ^cual es la probabilidad de que a lo sumo cuatro presen- 
ten el factor Rh? 

c ^Cual es el numero mas pequeno de voluntaries que deben seleccionarse si deseamos tener certeza 
de al menos 90% de obtener al menos cinco donadores con factor Rh? 
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3.62 Goranson y Hall (1980) explican que la probabilidad de detectar una grieta en el ala de un avion es el 
producto de p v la probabilidad de inspeccionar un avion con una grieta en un ala; p la probabilidad de 
inspeccionar el detalle donde se ubica la grieta; y p 3 , la probabilidad de detectar el dano. 

a (,Que suposiciones justifican la multiplicacion de estas probabilidades? 

b Suponga que p 3 = .9, p 2 = .8 y p 3 = .5 para cierta flota de aviones. Si se inspeccionan tres aviones 
de esta flota, encuentre la probabilidad de que una grieta en el ala sea detectada en al menos uno de 
ellos. 


*3.63 


Considere la distribucion binomial con n pruebas y P(S ) = p. 


a Demuestre que 


piy) 
piy- 1 ) 


(n - y + 1 )p 

yq 


para y — 1, 2,... ,n. De modo equivalente, para 


y = 1, 2, .... n, la ecuacion p(y) = —---— —p(y — 1) da una relacion repetitiva entre las 

yq 

probabilidades asociadas con valores sucesivos de Y. 
b Si n = 90 y p = .04, use la relacion citada en el inciso anterior para hallar P(Y < 3). 


ply) (n — y + l)p , p(y) 

c Demuestre que-'- = - > 1 si y < [n + \)p, que - 1 - < 1 si y > (n + 

pi.y - 1 ) yq ' piy - 1 ) 

piy) 

1 )p, y que--- = 1 si(n +1) es un entero y y = (n + 1 )p. Esto establece quep(v) > piy ~ 1) si y 

piy ~ 1) 

es pequena (y < in + I )p) y piy) < piy - 1) si y es grande (y > in + I )p). Entonces, las probabilidades 
binomiales sucesivas aumentan por algun tiempo y disminuyen de ahf en adelante. 

d Demuestre que el valor de y asignado a la probabilidad mas grande es igual al maximo entero menor 
o igual que (n + l)p. Si (n + 1 )p = m para algun entero m , entonces pirn) = p{m - 1). 


*3.64 Considere una extension de la situacion estudiada en el Ejemplo 3.10. Si hay n pruebas en un experi- 
mento binomial y observamos y 0 “exitos”, demuestre que P(Y = v 0 ) se maximiza cuando p = y 0 /n. De 
nuevo, estamos determinando (en general esta vez) el valor de p que maximice la probabilidad del valor 
de Y que observamos realmente. 


*3.65 Consulte el Ejercicio 3.64. El estimador de la maxima probabilidad parap es Y/n (notese que Y es la 
variable aleatoria binomial, no un valor particular de ella). 

a Deduzca E(Y/n). En el Capftulo 9 veremos que este resultado implica que Y/h es un estimador 
no sesgado para p. 

b Deduzca V(Y/n). ),Que le ocurre a V(Y/n ) cuando n se hace grande? 


3.5 La distribucion de probabilidad geometrica 

La variable aleatoria con distribucion de probabilidad geometrica esta asociada con un 
experimento que comparte algunas de las caracterfsticas de un experimento binomial. 
Este experimento tambien comprende pruebas identicas e independientes, cada una de 
las cuales puede arrojar uno de dos resultados: exito o fracaso. La probabilidad de exito 
es igual a p y es constante de una prueba a otra. No obstante, en lugar del numero de exitos que 
se presentan en n pruebas, la variable aleatoria geometrica Y es el numero de prueba en la 
que ocurre el primer exito. Entonces, el experimento consiste en una serie de pruebas que con- 
cluye con el primer exito. En consecuencia, el experimento podrla terminar con la primera prue¬ 
ba si se observa un exito en la misma o el experimento podrfa continuar de manera indefinida. 
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DEFINICION 3.8 


FIGURA 3.5 
La distribucion 
de probabilidad 
geometrica, p = .5 


El espacio muestral 
puntos muestrales: 

E t : S 
E 2 : FS 
E 3 : FFS 
E 4 : FFFS 

E^: FFFF ... FS (primer exito en la E= sima prueba ) 

S -V- J 

k -1 

Como la variable aleatoria Y es el numero de intentos hasta el primer exito, incluido este los 
eventos (Y = 1), (Y = 2) y (Y = 3) contienen solo los puntos muestrales E v E 2 y E v respec- 
tivamente. En forma mas general, el evento numerico ( Y = y ) contiene solo a E . Como las 
pruebas son independientes, para cualquier y = 1 , 2 , 3 ,..., 

p(y) = P(Y = y) = P(E y ) = P( FFFF ... F S) = qqq • • • q p = q y ~' p. 

y-l y-l 

Se dice que una variable aleatoria Y tiene una distribucion de probabilidad geometrica 
si y solo si 

p(y)=q y -'p, y = 1, 2, 3,..., 0 <p < 1. 


S para el experimento contiene el conjunto infinitamente contable de 

(exito en la primera prueba) 

(fracaso en la primera, exito en la segunda) 

(primer exito en la tercera prueba) 

(primer exito en la cuarta prueba) 


En la Figura 3.5 se ilustra un histograma de probabilidad para ply), p = .5. Las areas sobre 
los intervalos corresponden a probabilidades, como correspondieron a las distribuciones de 
frecuencia de datos en el Capitulo 1, excepto que Y puede tomar solo valores discretos, y = 
1,2,..., oo . Por inspeccion de los valores respectivos es obvio que ply) > 0 . En el Ejercicio 
3.66 demostrara que estas probabilidades ascienden a 1, como se requiere para cualquier dis¬ 
tribucion de probabilidad discreta valida. 
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La distribution de probabilidad geometrica se emplea con frecuencia para modelar dis- 
tribuciones de la duration de tiempos de espera. Por ejemplo, suponga que el motor de un 
avion comercial recibe atencion periodicamente para cambiar sus diversas partes en puntos 
diferentes de tiempo y que, por tanto, son de edades que varfan. Entonces la probabilidad p 
de mal funcionamiento del motor durante cualquier intervalo de operation de una hora ob- 
servado al azar podrfa ser el mismo que para cualquier otro intervalo de una hora. El tiempo 
transcurrido antes de que el motor falle es el numero de intervalos de una hora, Y, hasta que 
ocurra la primera falla. (Para esta aplicacion, el mal funcionamiento del motor en un periodo 
determinado de una hora se define como exito. Observe que como en el caso del experimento 
binomial, cualquiera de los dos resultados de una prueba se puede definir como exito. De 
nuevo, un “exito” no es necesariamente lo que podrfa considerarse como “bueno” en nuestra 
conversation de todos los dfas.) 

EJEMPLO 3.11 

Suponga que la probabilidad de mal funcionamiento de un motor durante cualquier periodo 
de una hora es p = .02. Encuentre la probabilidad de que un motor determinado funcione bien 
dos horas. 

Solucion 

Si denotamos con Y el numero de intervalos de una hora hasta la primera falla, tenemos 


00 

Pffunciona bien dos horas) = P(Y > 3) = p(y)- 

y=3 

00 

Como £ P(y) = 1, 

y= 1 

2 

Pffunciona bien dos horas) = 1 — p(y) 

y=\ 

= 1 - p - qp = 1 - .02 - (.98)(.02) = .9604. ■ 



Si examina la formula para la distribution geometrica dada en la Definition 3.8, vera que 
valores mas grandes de p (y por tanto valores menores de q ) llevan a probabilidades mas altas 
para los valores mas pequenos de Y v en consecuencia a menores probabilidades para los 
valores mas grandes de Y. Asf, el valor medio de Y parece ser inversamente proporcional a p. 
Como demostramos en el siguiente teorema, la media de una variable aleatoria con distribu¬ 
tion geometrica en realidad es igual a 1 /p. 

TEOREMA 3.8 

Si Y es una variable aleatoria con una distribution geometrica. 

Demostracion 

1 , 1 — p 

P = E{Y) = - y CT 2 = y( 7 ) = _L. 

P P 

OO OO 

E{Y) = Y J ya y ~ l p = pY.y^'- 

y= 1 y=l 
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Esta serie podrfa parecer dificil de sumarse directamente. En realidad, se puede sumar 
con facilidad si tomamos en cuenta que, para y > 1, 


—( q y) = yq y~\ 

d q 


y, por tanto, 






y-l 


y =i 


(El intercambio de derivada y suma aqui se puede justificar.) Sustituyendo, obtenemos 




y=l 


La ultima suma es la serie geometrica, q + q 2 + q 3 + ..., que es igual a q/(l - </)(vea 
elApendiceAl.il). Por tanto, 


d 

E(Y) = p —— 
dq 






1 

P 


Para resumir, nuestro metodo es expresar una serie que no se puede sumar directamente 
como la derivada de una serie para la cual la suma se puede obtener con facilidad. Una 
vez que evaluemos la serie mas facilmente manejable, derivamos para completar el pro- 
ceso. 

La derivation de la varianza se deja como Ejercicio 3.85. 


EJEMPLO 3.12 Si la probabilidad de falla de un motor durante cualquier periodo de una hora es p = .02 y 
Y denota el numero de intervalos de una hora hasta la primera falla, encuentre la media y la 
desviacion estandar de Y. 

Solution A1 igual que en el Ejemplo 3.11, se deduce que Y tiene una distribucion geometrica con 
p = .02. Entonces, E(Y) = 1 /p = 1 /(.02) = 50, y esperariamos unas pocas horas antes de en- 
contrar una falla. Ademas, V(Y) = .98/.0004 = 2450, y se deduce que la desviacion estandar 
de Y es a = V2450 = 49.497. ■ 


Aun cuando el calculo de probabilidades asociado con variables aleatorias geometricas se 
puede efectuar al evaluar un solo valor o sumas parciales asociadas con una serie geometrica, 
estas probabilidades tambien se pueden hallar con el uso de varios paquetes de software. Si 
Y tiene una distribucion geometrica con probabilidad p de exito, P(Y = v 0 ) = p(y 0 ) se puede 
hallar con el uso del comando dgeom (yo~l, p) de R (o S-Plus), mientras que P(Y < y 0 ) se 
encuentra usando el comando pgeom (yo~l, p) de R (o ,S'-PI us). Por ejemplo el comando 
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pgeom (1,0.0 2 ) de R (o .S'-FI ns) da el valor para Pi Y < 2) que implfcitamente se uso en el 
Ejemplo 3.11. Observe que el argumento enestos comandos es el valor v () - 1, no el valor y 0 . Esto 
es porque algunos autores prefieren definir que la distribucion geometrica sea la de la variable 
aleatoria Y* = el numero defracasos antes del primer exito. En nuestra formulation, la varia¬ 
ble aleatoria geometrica Y se interpreta como el numero de intento en los que ocurre el primer 
exito. En el Ejercicio 3.88 vera que Y* = Y— 1. Debido a esta relation entre las dos versio- 
nes de variables aleatorias geometricas, P(Y = y () ) = Pi Y — 1 = y 0 — 1) = P(Y* = yo — 1). 
R calcula probabilidades asociadas con Y*, explicando por que los argumentos para dgeom y 
pgeom son y 0 - 1 en lugar de y 0 . 

El siguiente ejemplo, semejante al Ejemplo 3.10, ilustra la forma en que la distribucion de 
probabilidad geometrica se puede usar para estimar un valor desconocido de p, la probabilidad 
de un exito. 


EJEMPLO 3.13 Suponga que entrevistamos personas sucesivas que trabajan para la gran empresaestudiada en 
el Ejemplo 3.10 y detenemos las entrevistas cuando encontramos a la primera persona que le 
guste esa polftica. Si la quinta persona entrevistada es la primera que esta a favor de la nueva 
polftica, encuentre una estimacion para p, la proportion verdadera pero desconocida de em- 
pleados que estan a favor de la nueva polftica. 

Solution Si Y denota el numero de personas entrevistadas hasta que hallemos la primera a quien le 
guste el nuevo plan de retiro, es razonable concluir que Y dene una distribucion geometrica 
para algun valor de p. Cualquiera que sea el verdadero valor para p, concluimos que la proba¬ 
bilidad de observar la primera persona a favor de la polftica en el quinto intento es 


P(Y = 5) =(1 -pfp. 

Usaremos como nuestra estimacion para p, el valor que maximice la probabilidad de observar 
el valor que en realidad obsen’amos (el primer exito en el intento 5). 

Para hallar el valor de p que maximice a P(Y = 5), de nuevo observamos que el valor de p 
que maximice a P(Y = 5) = (1 - pfp es igual que el valor de p que maximice a ln[(l - p f p] 
= [4 ln(l — p) + ln(p)]. 

Si evaluamos la derivada de [4 ln(l — p) + ln(p)] con respecto a p, obtenemos 
r/[41n(l — p) + ln(p)] —4 1 

dp 1 — p p 

Si igualamos a cero esta derivada y resolvemos, obtenemos p= 1 /5. 

Como la segunda derivada de [4 ln(l —p) + Ini/?)] es negativa cuando p = 1 /5, se deduce 
que [4 ln(l — p) + ln(p)][y P(Y = 5)] se maximiza cuando p = 1/5. Nuestra estimacion para 
p, basada en observar el primer exito en el quinto intento es 1/5. 

Quiza este resultado es un poco mas sorprendente que la respuesta que obtuvimos en el 
Ejemplo 3.10 cuando estimamos p con base en observar 6 a favor del nuevo plan en una mues- 
tra de tamano 20. De nuevo, este es un ejemplo del uso del metodo de maxima probabilidad 
que estudiaremos con mas detalle en el Capftulo 9. ■ 
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Ejercicios 


3.66 Suponga que Y es una variable aleatoria con distribution geometrica. Demuestre que 
a EyP(y) = E”=l9 > “ 1 /’ = 1 
p(y ) 

b ^ ^ = g, para y = 2, 3,_Esta relation es menor que 1, lo cual implica que las probabilida- 

des geometricas estan decreciendo en forma monotonica como funcion de y. Si Y tiene una distribution 
geometrica, ^que valor de Y es el mas probable (tiene la mas alta probabilidad)? 


3.67 Suponga que 30% de los solicitantes para cierto trabajo industrial posee capacitacion avanzada en pro- 
gramacion computacional. Los candidatos son elegidos aleatoriamente entre la poblacion y entrevista- 
dos en forma sucesiva. Encuentre la probabilidad de que el primer solicitante con capacitacion avanzada 
en programacion se encuentre en la quinta entrevista. 


3.68 Consulte el Ejercicio 3.67. ^Cual es el numero esperado de solicitantes que sera necesario entrevistar 
para hallar el primero con capacitacion avanzada? 

3.69 Unos seis meses despues del segundo periodo de George W. Bush como presidente, una encuesta 
de Gallup indico que un nivel (bajo) muy cerca del record de 41% de adultos expresaron “mucha” 
o “bastante” confianza en la suprema corte de Estados Unidos ( http://www. gallup.com./poll/contenl/ 
default.aspx?ci=17011) . junio de 2005). Supongamos que usted realizo su propia encuesta telefoni- 
ca en ese tiempo y al azar llamo a personas y les pidio describieran su nivel de confianza en la su¬ 
prema corte. Encuentre la distribution de probabilidad de Y, el numero de llamadas hasta que se en¬ 
cuentre la primera persona que no exprese “mucha” o “bastante” confianza en la suprema corte de 
Estados Unidos. 


3.70 Una empresa de exploration petrolera va a hacer una serie de perforaciones de sondeo en una zona deter- 
minada en busca de un pozo productivo. La probabilidad de que tenga exito en un intento dado es .2. 

a ^Cual es la probabilidad de que la tercera perforation sea la primera en dar un pozo productivo? 

b Si la empresa puede darse el lujo de perforar a lo sumo diez pozos, ^cual es la probabilidad de que no 
encuentre un pozo productivo? 

3.71 Denote con Y una variable aleatoria geometrica con probabilidad de exito p. 
a Demuestre que para un entero positivo a. 


P(Y > a) = q a . 

b Demuestre que para los enteros positivos ay b. 


P(Y > a +b\Y > a) = q h = P(Y > b ). 

Este resultado implica que, por ejemplo, P(Y > 7|F > 2) = P{Y > 5). (,Por que supone que esta 
propiedad recibe el nombre de propiedad sin memoria de la distribution geometrica? 

c En el desarrollo de la distribution de la variable aleatoria geometrica supusimos que el experimento con- 
sistio en realizar intentos identicos e independientes hasta que se observo el primer exito. En vista de estas 
suposiciones, ^por que es “obvio” el resultado en el inciso b? 

3.72 Dado que ya hemos lanzado al aire una rnoneda balanceada diez veces y no obtuvimos caras, ^,cual es la 
probabilidad de que debemos lanzarla al menos dos veces mas para obtener la primera cara? 

3.73 Un contador publico certificado (CPA, por sus siglas en ingles) ha encontrado que nueve de entre diez 
compafuas auditadas contienen errores importantes. Si el CPA hace auditorfa a una serie de cuentas de 
empresas, ^,cual es la probabilidad de que la primera cuenta que contenga errores importantes 

a sea la tercera en ser auditada?, 
b sea la tercera cuenta auditada la que le sigue? 
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3.74 Consulte el Ejercicio 3.73. ^Cuales son la media y la desviacion estandar del numero de cuentas que 
deben ser examinadas para hallar la primera con errores importantes? 

3.75 La probabilidad de que llegue un cliente al mostrador de servicio de una tienda en un segundo cualquiera 
es igual a . 1. Suponga que llegan clientes en forma aleatoria y por tanto que una llegada en un segundo 
cualquiera es independiente de las otras. Encuentre la probabilidad de que la primera llegada 

a ocurra durante el tercer intervalo de un segundo. 

b no ocurra hasta al menos el tercer intervalo de un segundo. 

3.76 Si Y tiene una distribution geometrica con probabilidad de exito .3, ^cual es el maximo valor, y 0 , tal que 
P(F>y 0 )>.l? 

3.77 Si Y tiene una distribution geometrica con probabilidad p de exito, demuestre que 

p 

P{Y = un entero impar) = --. 

1 - q 2 

3.78 De una poblacion de consumidores, 60% tienen fama de preferir una marca particular. A, de pasta 
dental. Si se entrevista a un grupo de consumidores escogidos al azar, ^cual es la probabilidad de que 
exactamente cinco personas tengan que ser entrevistadas para hallar el primer consumidor que prefiera 
la marca A? ^A1 menos cinco personas? 

3.79 Al contestar una pregunta de encuesta en un tenia delicado (por ejemplo: “^Ha fumado mariguana 
alguna vez?”), muchas personas prefieren no contestar de manera afirmativa. Suponga que 80% de la 
poblacion no ha fumado mariguana y que todos contestan negativamente con verdad a la pregunta. El 
20% restante de la poblacion han fumado mariguana y 70% de ellos mentiran. Deduzca la distribution 
de probabilidad de Y, el numero de personas a las que serfa necesario preguntar para obtener una sola 
respuesta afirmativa. 

3.80 Dos personas, por turnos, tiran un dado impartial hasta que una de ellas lanza un 6. La persona A tiro 
primero, la B en segundo, A en tercero y asf sucesivamente. En vista de que la persona B tiro el primer 
6, ^,cual es la probabilidad de que B obtenga el primer 6 en su segundo tiro (es decir, en el cuarto tiro 
total)? 

3.81 ^Cuantas veces esperarfa usted lanzar al aire una moneda balanceada para obtener la primera cara? 

3.82 Consulte el Ejercicio 3.70. La empresa hace perforaciones de exploration hasta que encuentra un pozo 
productivo. ^Cuantas perforaciones esperarfa hacer la empresa? Interprete intuitivamente su respuesta. 

3.83 Al secretario de los Ejercicios 2.121 y 3.16 se le dieron n contrasenas de computadora y la prueba al azar. 
Exactamente una de las contrasenas permite el acceso a un archivo de computadora. Suponga ahora que 
el secretario selecciona una contrasena, la intenta y si no funciona, la regresa con las otras antes de selec- 
cionar al azar la siguiente (jno es muy buen secretario!) ^Cual es la probabilidad de hallar la contrasena 
correcta en el sexto intento? 

3.84 Consulte el Ejercicio 3.83. Encuentre la media y la varianza de Y, el numero de intento en el que se 
identifica la contrasena correcta. 

*3.85 Encuentre E[Y{Y - 1)] para una variable aleatoria geometrica Y al hallar d 2 /dq 2 ^Y^ =l q y Use este 
resultado para hallar la varianza de Y. 

*3.86 Considere una extension de la situation examinada en el Ejemplo 3.13. Si observamos y 0 como el valor 
para una variable aleatoria geometrica F, demuestre que P(Y = y 0 ) se maximiza cuando p = 1 /y 0 . De 
nuevo, estamos determinando (en general esta vez) el valor de p que maximiza la probabilidad del valor 
de Y que en realidad observamos. 
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*3.87 Consulte el Ejercicio 3.86. El estimador de la maxima probabilidad para p es 1 /F (observe que F es la 
variable aleatoria geometrica, no un valor particular de ella). Deduzca E( 1 /Y). [Sugerencia: si |r| < 1, 

El°=i r‘/i = “Ml -'•)■] 

*3.88 Si Y es una variable aleatoria geometrica, defina Y* = F-l . Si Y se interpreta como el numero del intento 

en el que ocurre el primer exito, entonces F* se puede interpretar como el numero de fracasos antes del 
primer exito. Si F* = Y— 1, P{Y* = y) = P(Y— 1 = y) = P(Y = y + 1) para y = 0, 1, 2,... Demuestre 
que 

P(Y*=y) = <?p, y = 0,1,2,.... 

La distribucion de probabilidad de F* es empleada en ocasiones por actuarios como modelo para la 
distribucion del numero de reclamaciones de seguro hechas en un tiempo especifico. 

*3.89 Consulte el Ejercicio 3.88. Deduzca la media y la varianza de la variable aleatoria F* 

a usando el resultado del Ejercicio 3.33 y la relation F* = Y- 1, donde F es geometrica, 

*b directamente, usando la distribucion de probabilidad para F* dada en el Ejercicio 3.88. 

3.6 La distribucion de probabilidad 
binomial negativa (opcional) 

Una variable aleatoria con distribucion binomial negativa se origina de un contexto semejante 
al que da la distribucion geometrica. De nuevo nos concentramos en intentos independientes e 
identicos, cada uno de los cuales conduce a uno de dos resultados: exito o fracaso. La proba¬ 
bilidad p de exito sigue siendo igual de un intento a otro. La distribucion geometrica maneja el 
caso donde estamos interesados en el numero de intento en el que ocurre el primer exito. qQue 
pasa si estamos interesados en conocer el numero de intento en el que ocurre el exito segundo, 
tercero o cuarto? La distribucion que se aplica a la variable aleatoria Y igual al numero del in¬ 
tento en el que ocurre el r-esimo exito (r = 2, 3, 4, etc.) es la distribucion binomial negativa. 

Los pasos siguientes se asemejan estrechamente a los de la section anterior. Seleccionemos 
valores fijos para r y y y consideremos los eventos Ay B, donde 

A = {los primeros (y-1) intentos contienen (r- 1) exitos} 


y 


B = {el intento y resulta en un exito}. 

Como suponemos que los intentos son independientes, se deduce que Ay B son eventos inde¬ 
pendientes y las suposiciones previas implican que P{B) = p. Por tanto, 

p(y) = p(Y = y) = P(A ns) = P(A) X P(B). 

Observe que P(A) es 0 si (y -1) < (r— 1) o, de igual manera, si y < r. Si y > r, nuestro trabajo 
previo con la distribution binominal implica que 

P ( A ) = (rliy~V" r - 
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Por ultimo, 


p(y) 



y = r, r + 1, r + 2,... 


DEFINICION 3.9 


Se dice que una variable aleatoria Y tiene una distribution de probabilidad binomial 
negativa si y solo si 


p(y) 



y = r, r + 1, r + 2,..0 < p < 1. 


EJEMPLO 3.14 Un estudio geologico indica que un pozo petrolero de exploracion perforado en una region 
particular debe producir petroleo con probabilidad .2. Encuentre la probabilidad de que el 
tercer descubrimiento de petroleo llegue en el quinto pozo perforado. 

Solucion Suponiendo perforaciones independientes y probabilidad .2 de descubrir petroleo en cualquie- 
ra de los pozos, denote con Y el numero del intento en el que ocurre el tercer descubrimiento 
de petroleo. Entonces, es razonable suponer que Y tiene una distribucion binomial negativa 
con p = .2. Como estamos interesados en r = 3 y y = 5, 


P(F = 5) =p(5) 


)(. 2 ) 3 (. 8) 2 


6(.008)(. 64) = .0307. 


Si r = 2, 3, 4,... y Y tiene una distribucion binomial negativa con probabilidad p de exito, 
P(Y = y 0 ) = p(y 0 ) se puede hallar usando el comando pnbinom( yo-r , r , p) de R (o S-Plus). 
Si queremos utilizar R para obtener p( 5) en el Ejemplo 3.14, usamos el coman¬ 
do dnbinom(2,3, .2). Alternativamente, P(Y < y 0 ) se encuentra usando el comando 
pnbinom( yo-r, r , p) de R (o .S’- PI us). Observe que el primer argumento de estos coman- 
dos es el valor y Q - r, no el valor y 0 . Esto es porque algunos autores prefieren definir que la 
distribucion binomial negativa sea la de la variable aleatoria Y * = el numero de fracasos antes 
del r-esimo exito. En nuestra formulacion, la variable aleatoria binomial negativa, K, se inter- 
preta como el numero del intento en el que ocurre el r-esimo exito. En el Ejercicio 3.100 vera 
que Y* = Y— r. Debido a esta relacion entre las versiones de variables aleatorias binomiales 
negativas, P(Y = yo) = P(Y —r = yo — r) = P(Y * = yo — r). R calculaprobabilidades 
asociadas con Y*, lo que explica por que los argumentos para dnbinom y pnbinom son 
y 0 - r en lugar de y 0 . 

La media y la varianza de una variable aleatoria con distribucion binomial negativa se 
pueden deducir directamente de las Definiciones 3.4 y 3.5 mediante el uso de tecnicas como 
las ilustradas previamente, pero sumar la serie infinita resultante es tedioso. Estas deduccio- 
nes seran mucho mas faciles despues que hayamos desarrollado algunas de las tecnicas del 
Capftulo 5. Por ahora, expresamos el siguiente teorema sin prueba. 
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TEOREMA 3.9 


Si Y es una variable aleatoria con una distribution binomial negativa, 


M = E(Y) = - 
P 


y o- 2 = V(Y) 


r(l-p) 


EJEMPLO 3.15 Una gran acumulacion de bombas usadas contiene 20% que necesitan ser reparadas. Una tra- 
bajadora de mantenimiento es enviada a esas bombas con tres juegos de piezas de reparacion. 
Ella selecciona bombas al azar y las prueba una por una. Si la bomba funciona, la separa para 
usarla mas adelante pero, si no funciona, utiliza uno de los conjuntos de reparacion en la bom¬ 
ba. Suponga que le lleva 10 minutos probar una bomba que esta en buenas condiciones y 30 
minutos para probar y reparar una bomba que no funciona. Encuentre la media y la varianza 
del tiempo total que tarda la trabajadora para usar sus tres equipos de reparacion. 


Solution Denote con Y el nurnero del intento en el que se localiza la tercera bomba que no funciona. Se 
deduce que Ftiene una distribution binomial negativa con/? = .2. Entonces, E( Y) = 3 /(.2) =15 
y V(Y) = 3(.8)/(.2) z = 60. Debido a que se requieren otros 20 minutos para reparar cada 
bomba defectuosa, el tiempo total necesario para usar los tres equipos de reparacion es 

T = 10Y + 3(20). 

Usando el resultado obtenido en el Ejercicio 3.33, vemos que 

E(T) = 10£(F) + 60 = 10(15) + 60 = 210 


y 


V(T) = 10 2 V(Y) = 100(60) = 6000. 


En consecuencia, el tiempo total necesario para usar los tres equipos de reparacion tiene me¬ 
dia de 210 y desviacion estandar V6000 = 77.46. I 


Ejercicios 

3.90 Los empleados de una empresa que manufacture aislamientos estan siendo examinados en busca de in- 
dicios de asbesto en sus pulmones. La empresa ha sido requerida para enviar tres empleados que tengan 
indicios positivos de asbesto a un centra medico para realizarles examenes adicionales. Si 40% de los 
empleados tienen indicios positivos de asbesto en sus pulmones, encuentre la probabilidad de que diez 
empleados deban ser examinados para hallar tres positivos. 

3.91 Consulte el Ejercicio 3.90. Si cada examen cuesta $20, encuentre el valor y la varianza esperados del 
costo total de realizar los examenes necesarios para hallar los tres positivos. 

3.92 Diez por ciento de los motores fabricados en una linea de ensamble son defectuosos. Si los motores se 
seleccionan al azar uno a la vez y se prueban, /cual es la probabilidad de que el primer motor no defec- 
tuoso sea hallado en el segundo intento? 
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3.93 Consulte el Ejercicio 3.92. ^,Cual es la probabilidad de que el tercer motor no defectuoso sea hallado 

a en el quinto intento?, 
b en el quinto intento o antes? 

3.94 Consulte el Ejercicio 3.92. Encuentre la media y la varianza del numero del intento en el que 

a sea hallado el primer motor no defectuoso, 
b sea hallado el tercer motor no defectuoso. 

3.95 Consulte el Ejercicio 3.92. Dado que los primeros dos motores probados resultaron defectuosos, ^cual 
es la probabilidad de que al menos dos motores mas deban ser probados antes de hallar el primero no 
defectuoso? 

3.96 Las lrneas telefonicas que dan servicio a la oficina de reservaciones de una aerolfnea estan todas ocupa- 
das alrededor de 60% del tiempo. 

a Si una persona llama a esta oficina, ^cual es la probabilidad de que complete su llamada en el primer 
intento? ^En el segundo intento? ^En el tercero? 

b Si usted y un amigo deben ambos completar llamadas a esta oficina, ^,cual es la probabilidad de que 
un total de cuatro intentos sean necesarios para que los dos terminen su comunicacion? 

3.97 Un estudio geologico indica que un pozo petrolero de exploration debe descubrir petroleo con probabi¬ 
lidad .2. 

a ^Cual es la probabilidad de que el primer hallazgo sea en el tercer pozo perforado? 
b ^Cual es la probabilidad de que el tercer hallazgo sea en el septimo pozo perforado? 
c ^Que suposiciones se hicieron para obtener las respuestas a los incisos a y b? 

d Encuentre la media y la varianza del numero de pozos que deben ser perforados si la companfa desea 
abrir tres pozos productores. 

*3.98 Considere la distribution binomial negativa dada en la Definition 3.9. 


a Demuestre que si y > r + 1, 


p(y) 
p{y - i) 


y-i 

y - r 


q. Esto establece una relation repetitiva entre 


probabilidades binomiales negativas sucesivas, porque p(y) = p(y - 1) X 




b Demuestre que 


7 > 


p(y) 
P(y - 1) 


7~1 
y - r 


p(y ) 


y — n 

a > 1 si v < -—. Del mismo modo, —' '— < 1 si 

1 -q p(y - 1) 


i -q 


C Aplique el resultado del inciso b para el caso r = 7, p = .5 para determinar los valores de y para los 
que p{y) > p{y - 1). 


*3.99 En una secuencia de intentos identicos e independientes con dos posibles resultados en cada intento, S y 
F, y con P(S) = p, ^cual es la probabilidad de que exactamente y intentos ocurran antes que se presente 
el r— esimo exito? 


*3.100 Si Y es una variable aleatoria binomial negativa, defina Y * — Y-r. Si Y se interpreta como el numero de 

intento en el que ocurre el r-esimo exito, entonces Y * se puede interpretar como el numero de fracasos 
antes del r-esimo exito. 


a 


SiK* =Y -r, P(Y* = y) = P(Y - r = y) = P(Y = 
que P(Y*=y) = P 7 =0,1,2,... 


y + r) para y =0, 1, 2, ... demuestre 


b Deduzca la media y la varianza de la variable aleatoria Y * usando la relation Y* = Y— r, donde Y es 
binomial negativa y el resultado del Ejercicio 3.33. 
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*3.101 a Observamos una sucesion de intentos identicos e independientes con dos posibles resultados en cada 
intento, 5 y F, y con P(S) = p. El numero del intento en el que observamos el quinto exito, Y , tiene 
una distribucion binomial negativa con parametros r = 5 y p. Suponga que observamos el quinto 
exito en el onceavo intento. Encuentre el valor de p que maximice P{Y =11). 

b Generalice el resultado del inciso a para hallar el valor de p que maximice P(Y = y 0 ) cuando Y tiene 
una distribucion binomial negativa con parametros r (conocidos) y p. 


3.7 La distribucion de probabilidad 
hipergeometrica 

En el Ejemplo 3.6 consideramos una poblacion de votantes, 40% de los cuales estaban a favor 
del candidato Jones. Se selecciono una muestra de votantes y Y (el numero a favor de Jones) 
habfa de ser observado. Concluimos que si el tamano muestral n era pequeno con respecto al 
tamano poblacional N, la distribucion de Y podrfa ser calculada por medio de una distribucion 
binomial. Tambien determinamos que si n era grande con respecto a N, la probabilidad con¬ 
ditional de seleccionar un votante a favor de Jones en un muestreo posterior serfa afectado de 
manera importante por las preferencias observadas de personas seleccionadas en muestreos 
anteriores. Entonces los intentos no eran independientes y la distribucion de probabilidad para 
Y no podrfa ser calculada en forma adecuada por una distribucion de probabilidad binomial. 
Entonces, necesitamos desarrollar la distribucion de probabilidad para Y cuando n es grande 
con respecto a N. 

Suponga que una poblacion contiene un numero finito N de elementos que posee una de 
dos caracterfsticas. Asf, r de los elementos podrfan ser rojos y b = N-r, negros. Una muestra 
de n elementos se selecciona al azar de la poblacion y la variable aleatoria de interes es Y, el 
numero de elementos rojos de la muestra. Esta variable aleatoria tiene lo que se conoce como 
la distribution de probabilidad hipergeometrica. Por ejemplo, el numero de trabajadores que 
son mujeres, Y, en el Ejemplo 3.1 tiene la distribucion hipergeometrica. 

La distribucion de probabilidad hipergeometrica se puede obtener usando los teoremas 
combinatorios dados en la Seccion 2.6 y el metodo de punto muestral. Un punto muestral del 
espacio muestral S correspondera a una seleccion unica de n elementos, algunos rojos y el 
resto negros. Al igual que en el experimento binomial, cada punto muestral puede ser caracte- 
rizado por un n arreglo cuyos elementos correspondan a una seleccion de n elementos del total 
de N. Si cada elemento de la poblacion fuera a ser numerado de 1 a A, el punto muestral que 
indique la seleccion de artfculos 5, 7, 8, 64, 17,..., 87 aparecerfa como n arreglo. 

( 5, 7, 8, 64, 17,..., 87 ). 
n posiciones 

El numero total de puntos muestrales en S, por tanto, sera igual al numero de formas de se¬ 
leccionar un subconjunto de n elementos de entre una poblacion de N, o sea (;'j. Como la 
seleccion aleatoria implica que todos los puntos muestrales sean igualmente probables, 
la probabilidad de un punto muestral en S es 
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P(Ed = 


N 


toda Ej £S. 


El numero total de puntos muestrales del evento numerico Y = y es el numero de puntos mues- 
trales en S que contenga y elementos rojos y (n - y ) negros. Este numero se puede obtener al 
aplicar la regia inn (Section 2.6). El numero de formas de seleccionar y elementos rojos, para 
llenar y posiciones del n arreglo que representa un punto muestral, es el numero de formas de 
seleccionar y de un total de r, o sea Q. [Usamos la convencion (")=0 si h > a.\ El numero total 
de formas de seleccionar (n - y) elementos negros para llenar las restantes (n - v) posiciones 
en el n arreglo es el numero de formas de seleccionar in - y) elementos negros de un posible 
(N - r) o ( ,v J r ). Entonces el numero de puntos muestrales del evento numerico Y = y es el 
numero de formas de combinar un conjunto de y elementos rojos y (n-y) negros. Por la regia 
mn, este es el producto Q X (^_ r ). Sumando las probabilidades de los puntos muestrales del 
evento numerico Y = y (multiplicando el numero de puntos muestrales por la probabilidad 
comun por punto muestral), obtenemos la funcion de probabilidad hipergeometrica. 


DEFINICION3.10 Se dice que una variable aleatoria Y tiene una distribution de probabilidad hipergeome¬ 
trica si y solo si 



donde y es un entero 0, 1, 2,..., n , sujeto a las restricciones y < ry n-y < N— r. 


Con la convencion (£) = 0 si b > a, es evidente que p(y) > 0 para las probabilidades hi- 
pergeometricas. El hecho de que las probabilidades hipergeometricas ascienden a 1 se deduce 
del hecho que 



Un bosquejo de la prueba de este resultado aparece en el Ejercicio 3.216. 


EJEMPLO 3.16 Un problema importante encontrado por directores de personal y otros que se enfrentan a 
la seleccion del mejor candidato en un conjunto finito de elementos, queda ejemplificado en la 
siguiente situacion. De un grupo de 20 ingenieros con titulo de Ph.D, 10 de ellos son seleccio- 
nados al azar para un empleo. yCual es la probabilidad de que los 10 seleccionados incluyan 
los cinco mejores ingenieros del grupo de 20? 

Solucion Para este ejemplo, N = 20, n = 10 y r = 5. Esto es, hay solo 5 en el conjunto de 5 mejores 
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TEOREMA 3.10 


EJEMPLO 3.17 


ingenieros y buscamos la probabilidad de que Y = 5, donde Y denota el numero de me- 
jores ingenieros entre los diez seleccionados. Entonces 


p( 5) = 



/ 15! \ /10!10!\ 
\5!10 !) V 20! ) 


21 

1292 


.0162 


Suponga que una poblacion de tamano N esta formada por r unidades con el atributo y 
N - r sin este. Si se toma una muestra de tamano n, sin restitucion, y Y es el numero de ele- 
mentos con el atributo en la muestra, P(Y = y 0 ) = p(y 0 ) se puede hallar con el comando 
dhyper (y 0 , r, N-r, n) de R (o 5-Plus). El comando dhyper (5,5,15,10) da el valor 
para p( 5) en el Ejemplo 3.16. De manera alternativa, P(Y < y 0 ) se encuentra usando el coman¬ 
do phyper (y 0 , r, N-r, n) de R (o 5-Plus). 

La media y la varianza de una variable aleatoria con distribucion hipergeometrica se puede 
deducir directamente de las Definiciones 3.4 y 3.5. No obstante, deducir expresiones de forma 
cerrada para las sumatorias resultantes es un tanto tedioso. En el Capftulo 5 desarrollaremos 
metodos que permiten una deduccion de los resultados mucho mas sencilla que se presenta en 
el siguiente teorema. 


Si Y es una variable aleatoria con distribucion hipergeometrica, 


/x = E(Y) 


nr 

~N 



Aun cuando la media y la varianza de la variable aleatoria hipergeometrica parecen ser mas 
bien complicadas, presentan un sorprendente parecido con la media y la varianza de una varia¬ 
ble aleatoria binomial. De hecho, si definimos p = j^y q = 1 — p = podemos expresar 
tambien la media y la varianza de la hipergeometrica como p = npy 


Se puede ver el factor 


2 [N~n\ 

N - n 
N - 1 


en V(Y) como un ajuste que es apropiado cuando n es grande con respecto a N. Para n fija, 
cuando N^>oo, 

N — n 

-> 1 . 

N ~ 1 


Un producto industrial se envfa en lotes de 20. Es costoso realizar pruebas para determinar si 
un artfculo es defectuoso y, por tanto, el fabricante muestrea su produccion en lugar de usar un 
plan de inspeccion al 100%. Un plan de muestreo, construido para minimizar el numero de 
piezas defectuosas enviadas a los clientes, exige muestrear cinco artfculos de cada lote y re- 
chazar el lote si se observa mas de una pieza defectuosa. (Si el lote es rechazado, cada artfculo 
del mismo se prueba posteriormente.) Si un lote contiene cuatro piezas defectuosas, ^cual es 
la probabilidad de que sea rechazado? ^Cual es el numero esperado de piezas defectuosas en 
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la muestra de tamano 5? <' Cual es la varianza del numero de piezas defectuosas de la muestra 
de tamano 5? 

Solucion Sea E igual al numero de piezas defectuosas de la muestra. Entonces N = 20, r = 4 y n = 5. 
El lote sera rechazado si Y = 2, 3 o 4. Entonces 

P(rechazar el lote) = P(Y > 2) = p( 2) + p( 3) + p( 4) 

= i - MO) -MD 

(X) (X) 

(?) (?) 

= 1 - .2817 - .4696 = .2487. 


La media y varianza del numero de piezas defectuosas de la muestra de tamano 5 son 


/x = 


(5X4) 

20 


= 1 


cr 


= 5 ( — 

,20 


20-4\ /20 — 5 


20 


20 - 1 


= .632. 


El Ejemplo 3.17 comprende muestrear un lote de N productos industriales, de los cuales r 
son defectuosos. La variable aleatoria de interes es Y, el numero de defectuosos en la muestra 
de tamano n. Como se observo al principio de esta seccion, Y posee una distribucion aproxi- 
madamente binomial cuando N es grande y n es relativamente pequena. En consecuencia, 
esperariamos que las probabilidades asignadas a valores de Y por la distribucion hipergeome- 
trica se aproximen a las asignadas por la distribucion binomial cuando N se hace grande y 
r/N, la fraccion de piezas defectuosas de la poblacion, se mantiene constante e igual a p. El 
estudiante puede verificar esta expectativa si usa teoremas de limite, que encontrara en sus 
cursos de calculo, para demostrar que 

lfm , ("Vo - 

N ^°° C) w 

donde 

r 

N =P - 

(La prueba de este resultado se omite.) Por tanto, para una fraccion fija defectuosa p = r/N, la 
funcion de probabilidad hipergeometrica converge hacia la funcion de probabilidad binomial 
cuando N se hace grande. 


Ejercicios 

3.102 Una uma contiene diez canicas, de las cuales cinco son verdes, dos son azules y tres son rojas. Tres 
canicas se van a sacar de la uma, una a la vez sin reemplazo. ^,Cual es la probabilidad de que las tres 
canicas sacadas sean verdes? 

3.103 Un almacen contiene diez maquinas impresoras, cuatro de las cuales son defectuosas. Una companfa 
selecciona cinco de las maquinas al azar pensando que todas estan en buenas condiciones. ^,Cual es la 
probabilidad de que las cinco no sean defectuosas? 
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3.104 Se tienen 20 paquetes de polvo bianco, de identico aspecto, 15 de ellos contienen cocafna y 5 no la 
tienen. Cuatro paquetes se seleccionaron al azar, se probo su contenido y se encontro que contenfan 
cocafna. Se seleccionaron otros dos paquetes del resto y fueron vendidos por policfas secretos a un solo 
comprador. ^Cual es la probabilidad de que los 6 paquetes escogidos al azar sea tal que los primeros 
4 contengan cocafna y los 2 vendidos al comprador no la contengan? 

3.105 En el sur de California, un numero creciente de personas que tratan de obtener credenciales de profeso- 
res estan escogiendo internados pagados en vez de los programas tradicionales de ensenanza a estudian- 
tes. Un grupo de ocho candidatos para tres plazas de ensenanza locales estaba formado por cinco que se 
habfan inscrito en internados pagados y tres que se inscribieron en programas tradicionales de ensenanza 
a estudiantes. Los ocho candidatos parecen estar igualmente capacitados, de modo que se seleccionan 
tres al azar para ocupar las plazas abiertas. Sea F el numero de candidatos capacitados en internados que 
son contratados. 

a ^Tiene Y una distribucion hipergeometrica o binomial? ^Por que? 

b Encuentre la probabilidad de que sean contratados dos o mas candidatos capacitados en internados. 
c ^Cuales son la media y la desviacion estandar de F? 

3.106 Consulte el Ejercicio 3.103. La companfa repara las impresoras defectuosas a un costo de $50 cada una. 
Encuentre la media y la varianza del costo total de reparation. 

3.107 Un grupo de seis paquetes de software que hay para resolver un problema de programacion ha sido 
clasificado del 1 al 6 (del mejor al peor). Una firma de ingenierfa, no informada de la clasificacion, 
selecciona al azar y luego compra dos de los paquetes. Denote con Y el numero de paquetes comprados 
por la empresa que estan clasificados 3, 4, 5 o 6. De la distribucion de probabilidad para Y. 

3.108 Un embarque de 20 camaras incluye 3 que son defectuosas. ^Cual es el numero mfnimo de camaras que 
debe ser seleccionado si requerimos que P(al menos 1 defectuosa) a .8? 

3.109 Es frecuente que las semillas sean tratadas con fungicidas para protegerlas en ambientes humedos y con 
desecacion defectuosa. Un intento a pequena escala, que comprende cinco semillas tratadas y cinco no 
tratadas, fue realizado antes de un experimento a gran escala para explorar cuanto fungicida aplicar. Las 
semillas se plantaron en un suelo humedo y se conto el numero de plantas que brotaron. Si la solution 
no era efectiva y cuatro plantas brotaron en realidad, ^cual es la probabilidad de que 

a las cuatro plantas brotaran de semillas tratadas? 

b tres o menos brotaran de semillas tratadas? 

c al menos una brotara de semillas no tratadas? 

3.110 Una corporation esta muestreando sin reemplazo para n — 3 firmas para determinar aquella de la cual 
comprar ciertos abastecimientos. La muestra se ha de seleccionar de un grupo de seis firmas, de las 
cuales cuatro son locales y dos no. Denote con Y el numero de firmas no locales de entre las tres selec- 
cionadas. 

a P(Y = 1). 

b P(F> 1). 

c P(F< 1). 

3.111 Las especificaciones exigen que un termistor se pruebe entre 9000 y 10,000 ohms a 25° Celsius. Se dis¬ 
pone de diez termistores y tres de estos han de ser seleccionados para usarlos. Denote con F el numero 
de entre los tres que no se apegan a las especificaciones. Encuentre las distribuciones de probabilidad 
para F (en forma tabular) dadas las siguientes condiciones: 

a Dos termistores no se apegan a las especificaciones de entre los diez disponibles. 
b Cuatro termistores no se apegan a las especificaciones de entre los diez disponibles. 



130 


Capftulo 3 Variables aleatorias discretas y sus distribuciones de probabilidad 


3.112 Unas fotocopiadoras usadas son enviadas al proveedor, limpiadas y luego devueltas segun convenios de 
renta. No se hacen reparaciones importantes y en consecueneia algunos clientes reciben maquinas que 
no funcionan bien. Entre ocho fotocopiadoras disponibles hoy, tres de ellas estan funcionando mal. Un 
cliente desea rentar cuatro maquinas de inmediato. Para satisfacer la fecha lfmite fijada por el cliente, 
cuatro de las ocho maquinas se seleccionan al azar y, sin mas pruebas, son enviadas al cliente. ^Cual es 
la probabilidad de que el cliente reciba 

a maquinas que no funcionen mal? 
b al menos una maquina que funcione mal? 

3.113 Un jurado de 6 personas fue seleccionado de entre un grupo de 20 miembros de jurado potenciales, de 
los cuales 8 eran afroamericanos y 12 de raza blanca. Supuestamente, el jurado se selecciono al azar 
pero contenfa solo un afroamericano. ^Piensa el lector que hay alguna razon para dudar de la aleatorie- 
dad de la seleccion? 

3.114 Consulte el Ejercicio 3.113. Si el proceso de seleccion fuera realmente aleatorio, ^cuales sedan la media 
y la varianza del numero de afroamericanos seleccionados para el jurado? 

3.115 Suponga que un radio contiene seis transistores, dos de los cuales estan defectuosos. Se seleccionan 
al azar tres transistores, se retiran del radio y se inspeccionan. Sea F igual al numero de defectuosos 
observado, donde Y = 0, 1 o 2. Encuentre la distribution de probabilidad para Y. Exprese sus resultados 
graficamente como histograma de probabilidad. 

3.116 Simule el experimento descrito en el Ejercicio 3.115. al marcar seis canicas o monedas de rnodo que dos 
representen defectuosas y cuatro no defectuosas. Ponga las canicas en un sombrero, revuelvalas, saque 
tres y registre Y, el numero de defectuosas observado. Restituya las canicas y repita el proceso hasta que 
se hayan registrado n = 100 observations de Y. Construya un histograma de frecuencia relativa para 
esta muestra y comparelo con la distribution de probabilidad poblacional (Ejercicio 3.115). 

3.117 En una production de llnea de ensamble de robots industriales se pueden instalar conjuntos de cajas de 
engranes en un minuto cada una si los agujeros han sido taladrados correctamente en las cajas y en diez 
minutos si deben taladrarse agujeros. Hay veinte cajas de engranes en existencia, 2 con agujeros taladra¬ 
dos de manera incorrecta. Cinco cajas de engranes deben seleccionarse de entre las 20 disponibles para 
instalarse en los siguientes cinco robots. 

a Encuentre la probabilidad de que las 5 cajas de engranes ajusten correctamente. 

b Encuentre la media, la varianza y la desviacion estandar del tiempo que toma instalar estas 5 cajas de 
engranes. 

3.118 Se reparten cinco cartas al azar y sin reemplazo de una baraja de 52 cartas. ^.Cual es la probabilidad de 
que la mano contenga los 4 ases si se sabe que contiene al menos 3 ases? 

3.119 Se reparten cartas al azar y sin reemplazo de una baraja de 52 cartas. ^Cual es la probabilidad de que el 
segundo rey se reparta en la quinta carta? 

*3.120 Los tamanos de poblaciones de animales se calculan en ocasiones con el metodo de capturar, marcar y 
recapturar. En este metodo se capturan k animales, se marcan y luego se sueltan en la poblacion. Cierto 
tiempo despues se capturan n animales y se observa F, el numero de animales marcados de entre los n. Las 
probabilidades asociadas con F son una funcion de N, el numero de animales de la poblacion, de modo 
que el valor observado de F contiene information sobre esta N desconocida. Suponga que k — 4 ani¬ 
males son marcados y luego soltados. Una muestra de n = 3 animales se selecciona entonces al azar 
de entre la misma poblacion. Encuentre P(Y = 1) como funcion de N. ^.Que valor de N maximizara 
P(Y = 1)? 
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3.8 La distribucion de probabilidad de Poisson 

Suponga que deseamos hallar la distribucion de probabilidad del numero de accidentes auto- 
movilisticos ocurridos en un crucero particular durante un periodo de una semana. A primera 
vista esta variable aleatoria, el numero de accidentes, no parece estar ni remotamente relacio- 
nada con una variable aleatoria binomial, pero veremos que existe una relacion interesante. 

Considere el periodo, una semana en este ejemplo, como dividido entre n subintervalos, 
cada uno de los cuales es tan pequeno que a lo sumo un accidente podria ocurrir en el con 
probabilidad diferente de cero. Denotando con p la probabilidad de un accidente en cualquier 
subintervalo, tenemos, para todos los fines practicos, 

P(no ocurren accidentes en un subintervalo) = 1 —p, 

P(ocurre un accidente en un subintervalo) = p, 

P(ocurre mas de un accidente en un subintervalo) = 0. 

Entonces el numero total de accidentes en la semana es precisamente el numero total de su¬ 
bintervalos que contienen un accidente. Si la ocurrencia de accidentes puede ser considerada 
como independiente de un intervalo a otro, el numero total de accidentes tiene una distribu¬ 
cion binomial. 

Aun cuando no hay una forma unica de seleccionar los subintervalos y por tanto no co- 
nocemos ni n ni p. parece razonable que cuando dividimos la semana en un numero ma¬ 
yor de n subintervalos, disminuye la probabilidad p de un accidente en uno de estos su¬ 
bintervalos mas cortos. Haciendo A = np y tomando el limite de la probabilidad binomial 
p(y) = (")p- v (l — p) n y cuando n —» oo , tenemos 


lim (”V(1 ~P) n ~ y 

n —» oo \y 1 


lfm n(n -!)••• (n-y + 1) /AV / _ A x " y 

n * oo y\ \ n / \ n 


l fm n(n-l)...(n-y + l) 

n —>ooy\ 


A 

1 - - 
n 


L .Im (1 - -Y (1 - -Y( 1 - i 

y\n—> 


X | 1 - - | X •••X | 1 
n 


y -1 



Si observamos que 

limb--) = 

n > oo y n ) 

y todos los otros terminos a la derecha del limite tienen un limite de 1, obtenemos 

A 

P(y) = ~e~\ 

y'- 

(Nota : e = 2.718....) Se dice que las variables aleatorias que poseen esta distribucion tienen 
una distribucion de Poisson. En consecuencia, Y, el numero de accidentes por semana, tiene la 
distribucion de Poisson que acabamos de deducir. 
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Debido a que la funcion de probabilidad binomial converge a la de Poisson, las probabilida- 
des de Poisson se pueden usar para calcular sus similares binomiales para n grande, p pequena y 
A = np menor que, aproximadamente, 7. El Ejercicio 3.134 pide al estudiante calcular proba- 
bilidades binomiales y de Poisson correspondientes y demostrara lo adecuado del calculo. 

Es frecuente que la distribucion de probabilidad de Poisson brinde un buen modelo para la 
distribution de probabilidad del numero Y de eventos raros que ocurren en el espacio, tiempo, 
volumen o cualquier otra dimension, donde A es el valor promedio de Y. Como hemos obser- 
vado, proporciona un buen modelo para la distribucion de probabilidad del numero Y de acci- 
dentes automovilisticos, industriales y otros tipos en una unidad de tiempo determinada. Otros 
ejemplos de variables aleatorias con distribuciones aproximadas de Poisson son el numero de 
llamadas telefonicas manejadas por un conmutador en un intervalo, el numero de partlculas 
radiactivas que se desintegran en un periodo particular, el numero de errores que comete una 
mecanografa al escribir una pagina y el numero de automoviles que usan una rampa de acceso 
a una autopista en un intervalo de diez minutos. 


DEFINICION 3.11 


Se dice que una variable aleatoria Y tiene distribucion de probabilidad de Poisson si y 
solo si 

A V —A 

p(y) = —e A , y =0, 1, 2,... A > 0. 

y'- 


Como veremos en el Teorema 3.11, el parametro A que aparece en la formula para la dis¬ 
tribucion de Poisson es en realidad la media de la distribucion. 


EJEMPLO 3.18 Demuestre que las probabilidades asignadas por la distribucion de probabilidad de Poisson 
satisfacen los requisitos de que 0 < p(y) < 1 para toda y y ]T t ply) = 1. 

Solution Como A > 0, es obvio que p(y) > 0 para y = 0, 1, 2,..., y que p(y) = 0 de otro modo. 
Ademas, 


A- v 




-A _ -A 

e = e 


v=0 


v=0 


yi 




sr- 


y=0 


porque la suma infmita J77=n A y /y! es una expansion de serie de e A . En el Apendice Al.l 1 
se dan sumas de series especiales. ■ 


EJEMPLO 3.19 Suponga que se disena un sistema aleatorio de patrulla de politia para que un oficial de patru- 
11a pueda estar en un lugar de su ruta Y= 0, 1, 2, 3,. . . veces por periodo de media hora, con 
cada lugar visitado un promedio de una vez por periodo. Suponga que Y posee, aproximada¬ 
mente, una distribucion de probabilidad de Poisson. Calcule la probabilidad de que el oficial 
de patrulla no llegue a un lugar determinado durante un periodo de media hora. ( ' Cual es la 
probabilidad de que el lugar sea visitado una vez? ^Dos veces? AI menos una vez? 
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Solucion Para este ejemplo el periodo es media hora y el tuimero medio de visitas por intervalo de 
media hora es A = 1. Entonces 


p(y) = 


(1 ye- 1 


= — y = 0.1,2,... 


y'- yi 

El evento de que un lugar determinado no sea visitado en un periodo de media hora corres- 
ponde a (Y = 0), y 

P(Y = 0) = P ( 0) = e -^= e - x = .368. 


Del mismo modo, 


pO) = — = e 1 = .368, 


p( 2) 


e 1 e 1 


= .184. 


2 ! 2 

La probabilidad de que el lugar sea visitado al menos una vez es el evento (Y > 1). Entonces 


P(Y >1) = ^ p(y) = 1 - p( 0) = 1 - e" 1 = .632. 

y = l 


Si Y tiene una distribucion de Poisson con media A, P(Y = y 0 ) = p(y 0 ) se pueden hallar 
con el uso del comando dpois (yo, A). de R (o s-Plus). Si desearamos usar K para obtener 
p( 2) en el Ejemplo 3.19, usamos el comando dpois (2 , 1). Alternativamente, P(Y < y 0 ) se 
encuentra con el uso del comando de ppois (yo, A )R (o S-Plus). 


EJEMPLO 3.20 Cierto tipo de arbol tiene plantas que han crecido de semillas dispersas al azar en una super- 
ficie grande, con la densidad media de plantas siendo aproximadamente de cinco por yarda 
cuadrada. Si esa zona un guardabosques localiza al azar diez regiones de muestreo de 1 yar¬ 
da cuadrada, encuentre la probabilidad de que ninguna de las regiones contenga plantas que 
hay an crecido de semillas. 

Solucion Si las plantas realmente estan dispersas al azar, el numero de plantas por region, Y, se puede 
modelar como una variable aleatoria de Poisson con A = 5. (La densidad promedio es de 
cinco por yarda cuadrada.) Entonces, 


A°e~ A 

P(Y = 0) = p(0) = = e~ 5 = .006738. 

La probabilidad de que Y = 0 en diez regiones seleccionadas de manera independiente es 
(e -5 ) 10 porque la probabilidad de la interseccion de eventos independientes es igual al pro- 
ducto de las probabilidades respectivas. La probabilidad resultante es en extremo pequena. 
Entonces, si este evento ocurriera en realidad, cuestionarfa seriamente la suposicion de alea- 
toriedad, la densidad promedio de plantas expresada o ambos. ■ 
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EJEMPLO 3.21 


Solucion 


TEOREMA 3.11 


Demostracion 


Para comodidad del estudiante, damos en la Tabla 3, Apendice 3, las sumas parciales 
YTv=o p(y) P ara l a distribucion de probabilidad de Poisson para muchos valores de A entre 
.02 y 25. Esta tabla se ha elaborado de manera similar a la tabla de sumas parciales para la 
distribucion binomial, Tabla 1, Apendice 3. El siguiente ejemplo ilustra el uso de la Tabla 3 y 
demuestra que la distribucion de probabilidad de Poisson puede aproximar la distribucion de 
probabilidad binomial. 


Suponga que Y posee una distribucion binomial con n = 20 y p = . 1. Encuentre el valor exacto 
de P(Y < 3) usando la tabla de probabilidades binomiales, Tabla 1, Apendice 3. Use la Tabla 3, 
Apendice 3, para aproximar esta probabilidad, usando una probabilidad correspondiente dada 
por la distribucion de Poisson. Compare los valores exacto y aproximado para P(Y < 3). 

De acuerdo con la Tabla 1, Apendice 3, el valor exacto (hasta tres lugares decimales) de P( F < 3) 
= .867. Si W es una variable aleatoria con distribucion de Poisson con A = np = 20(.l) = 2, 
los analisis previos indican que P(Y < 3) es aproximadamente igual a P(W < 3). La Tabla 3, 
Apendice 3, [o el comando ppois (3 , 2 ) de R], da P(W < 3) = .857. Entonces, se puede 
ver que la aproximacion de Poisson es bastante buena, dando un valor que difiere del valor 
exacto en solo .01. ■ 


En nuestra deduccion de la media y la varianza de una variable aleatoria con distribucion 
de Poisson, de nuevo usamos la propiedad fundamental que JT p(y) = 1 para cualquier dis¬ 
tribucion de probabilidad discreta. 


Si Y es una variable aleatoria que posee una distribucion de Poisson con parametro A, 
entonces 


fi = E(Y) = A y o 2 = V(Y) = A. 

Por definition, 

00 x y p~x 

£« = £>(y) = £> —. 

V v=0 y- 

Observe que el primer termino de esta suma es igual a 0 (cuando y = 0) y, por tanto. 


e(Y) = Y j1 


y=l 


A- v e" A _ \ y e~ x 

~~h(y- 1 )! 


Asf como esta, esta cantidad no es igual a la suma de los valores de una funcion de pro¬ 
babilidad p(y) para todos los valores de y, pero podemos cambiarla a la forma apropiada 
al factorizar A de la expresion y haciendo z = y — 1 ■ Entonces los limites de sumatoria 
se convierten en z = 0 (cuando y = 1) y z = oo (cuando y = oo), y 


E(Y)= 

y=\ 


\ y ~ x e~ x 

(y-1)! 




z= 0 


A J e~ A 

z\ 
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EJEMPLO 3.22 


Solucion 


Observe que p(z) = AV A /z! es la funcion de probabilidad para una variable aleatoria 
de Poisson, y ^ x _ (l p(z) = 1. Por tanto, E(Y) = A. Entonces, la media de una variable 
aleatoria de Poisson es el parametro individual A que aparece en la expresion para la 
funcion de probabilidad de Poisson. 

Dejamos la obtencion de la varianza como Ejercicio 3.138. 


Una forma comiin de encontrar una variable aleatoria con una distribucion Poisson es 
por medio de un modelo llamado proceso Poisson, que es un modelo apropiado para si- 
tuaciones como la que se describe al principio de esta seccion. Si observamos un proce¬ 
so Poisson y A es el numero medio de sucesos por unidad (longitud, area, etc.), entonces 
Y = numero de sucesos en a unidades tiene una distribucion Poisson con media a\. Una 
suposicion clave en el desarrollo de la teorfa del proceso Poisson es la independencia de los 
numeros de sucesos en intervalos inconexos (areas, etc.). Vea en la obra de Hogg, Craigla, y 
McKean (2005) un desarrollo teorico del proceso Poisson. 


Ocurren accidentes industriales de acuerdo con un proceso Poisson con un promedio de tres 
accidentes por mes. Durante los ultimos dos meses ocurrieron diez accidentes. ^Este numero 
parece altamente improbable si el numero medio de accidentes por mes, p, es todavfa igual a 
3? ^ Indie a un aumento en el numero medio de accidentes por mes? 

El numero de accidentes en dos meses, Y, tiene una distribucion de probabilidad de Poisson 
con media A' = 2(3) = 6. La probabilidad de que Y sea de hasta 10 es 



El tedioso calculo necesario para hallar P(Y > 10) se puede evitar con el uso de la Tabla 3, 
Apendice 3, de software como R [ppois (9 , 6) da P(Y < 9)] o la regia empfrica. Del 

Teorema 3.11, 


V6 = 2.45. 


p = A* = 6, cr 2 = A* = 6. 


cr 


La regia empfrica nos dice que deberfamos esperar que Y tome valores en el intervalo p ± 2a 
con una alta probabilidad. 

Advierta que p + 2cr = 6 + (2)(2.45) = 10.90. El numero observado de accidentes, Y = 
10, no esta a mas de 2 cr de p, pero esta cerca de la frontera. Por tanto, el resultado observado 
no es altamente improbable, pero puede ser suficientemente improbable para garantizar una 
investigation. Vea en el Ejercicio 3.210 la probabilidad exacta P(\Y - A| < 2a). ■ 


EJEMPLO 3.22 


Solucion 
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Ejercicios 

3.121 Denote con Y una variable aleatoria que tenga una distribucion de Poisson con media A = 2. Encuentre 

a P(Y = 4). 
b P(Y >4). 
c P(Y < 4). 
d P(Y >4 K|>2). 

3.122 Llegan clientes a un mostrador de salida en una tienda de departamentos de acuerdo con una distribucion 
de Poisson, a un promedio de siete por hora. Durante una hora determinada, ^cuales son las probabili- 
dades de que 

a no lleguen mas de tres clientes?, 
b lleguen al menos dos clientes?, 
c lleguen exactamente cinco clientes? 

3.123 La variable aleatoria Y tiene una distribucion de Poisson y es tal que p( 0) = p(l ). ^,Cual es p( 2)? 

3.124 Aproximadamente 4% de las obleas de silicio producidas por un fabricante tienen menos de dos defec- 
tos grandes. Si Y, el numero de defectos por oblea, tiene una distribucion de Poisson, ^que proporcion 
de las obleas tiene mas de cinco defectos grandes? [Sugerencia: use la Tabla 3, Apendice 3.] 

3.125 Consulte el Ejercicio 3.122. Si se requieren alrededor de diez minutos para servir a cada cliente, encuen¬ 
tre la media y la varianza del tiempo total de servicio para clientes que lleguen durante un periodo de 
1 hora. (Suponga que hay un numero suficiente de dependientes para que el cliente no tenga que esperar 
ser atendido.) ^Es probable que el tiempo total de servicio exceda de 2.5 horas? 

3.126 Consulte el Ejercicio 3.122. Suponga que ocurren llegadas de acuerdo con un proceso de Poisson con 
un promedio de siete por hora. ^Cual es la probabilidad de que exactamente dos clientes lleguen en dos 
horas entre 

a las 2:00 p.m. y las 4:00 p.m. (un periodo continuo de dos horas)?, 

b la 1:00 p.m. y las 2:00 p.m. o entre las 3:00 p.m. y las 4:00 p.m. (dos periodos de una hora separados 
que totalizan dos horas)? 

3.127 El numero de errores mecanograficos hechos por una secretaria tiene una distribucion de Poisson con 
un promedio de cuatro errores por pagina. Si en una pagina se dan mas de cuatro errores, la secretaria 
debe volver a escribir toda la pagina. ^Cual es la probabilidad de que una pagina seleccionada al azar no 
tenga que volver a ser escrita? 

3.128 Llegan autos a una caseta de pago de peaje de acuerdo con un proceso de Poisson con media de 80 autos 
por hora. Si el empleado hace una llamada telefonica de 1 minuto, ^cual es la probabilidad de que al 
menos 1 auto llegue durante la llamada? 

3.129 Consulte el Ejercicio 3.128. ^Cuanto puede durar la llamada telefonica del empleado si la probabilidad 
es al menos .4 de que no lleguen autos durante la llamada? 

3.130 Un lote de estacionamiento tiene dos entradas. Llegan autos a la entrada I de acuerdo con una distri¬ 
bucion de Poisson a un promedio de tres por hora y a la entrada II de acuerdo con una distribucion de 
Poisson a un promedio de cuatro por hora. ^Cual es la probabilidad de que un total de tres autos lleguen 
al lote de estacionamiento en una hora determinada? (Suponga que los numeros de autos que llega a las 
dos entradas son independientes.) 

3.131 El numero de nudos en un tipo particular de madera tiene una distribucion de Poisson con un promedio 
de 1.5 nudos en 10 pies cubicos de madera. Encuentre la probabilidad de que un bloque de 10 pies cu- 
bicos de madera tenga a lo sumo 1 nudo. 

3.132 El numero medio de automoviles que entran al tunel de una montana por periodo de dos minutos es uno. 
Un numero excesivo de autos que entren al tunel durante un breve tiempo produce una situacion peligrosa. 
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3.133 


3.134 


3.135 


3.136 


3.137 

3.138 

3.139 


* 3.140 


3.141 


* 3.142 


Encuentre la probabilidad de que el numero de autos que entran durante un periodo de dos minutos exceda de 
tres. ^E1 modelo de Poisson parece razonable para este problema? 

Suponga que el tunel del Ejercicio 3.132 se observa durante diez intervalos de dos minutos, dando asf 
diez observaciones independientes Y i> Y 2 , , Y l0 , en la variable aleatoria de Poisson. Encuentre la pro¬ 
babilidad de que Y > 3 durante al menos uno de los diez intervalos de dos minutos. 

Considere un experimento binomial para n = 20, p = .05. Use la Tabla 1, Apendice 3, para calcular las 
probabilidades binomiales para Y = 0, 1, 2, 3 y 4. Calcule las mismas probabilidades usando la aproxi- 
macion de Poisson con A = np. Compare. 

Un vendedor ha encontrado que la probabilidad de una venta en un solo contacto es aproximadamente 
.03. Si el vendedor hace contacto con 100 posibles clientes, £cual es la probabilidad aproximada de 
hacer al menos una venta? 

Mas investigation y analisis se han concentrado en el numero de enfermedades en las que aparece el 
organismo Escherichia coli (10257:H7), que causa una ruptura de celulas sangumeas y hemorragia in¬ 
testinal en sus vfctimas (http://www.hsus.org/ace/11831, marzo 24, de 2004). Esporadicos brotes 
de E.coli han aparecido en Colorado a razon de aproximadamente 2.4 por 100,000 durante un periodo de 
dos anos. 

a Si este indice no ha cambiado y si 100,000 casos de Colorado se revisan para este ano, ^,cual es la 
probabilidad de que se observen al menos 5 casos de E.coli ? 

b Si 100,000 casos de Colorado se revisan para este ano y el numero de casos de E.coli excede de 5, ^,es 
de esperarse que haya cambiado la media estatal del Indice de E.coli ? Explique. 

La probabilidad de que un raton inoculado con un suero contraiga cierta enfermedad es .2. Usando la 
aproximacion de Poisson, encuentre la probabilidad de que al menos 3 de entre 30 ratones inoculados 
contraigan la enfermedad. 

Sea Y que tiene una distribucion de Poisson con media A. Encuentre E\Y(Y - 1)] y luego use esto para 
demostrar que V(Y) = A. 

En la production diaria de cierta clase de cuerda, el numero de defectos por pie Y se supone que tiene 
una distribucion de Poisson con media A = 2. La utilidad por pie cuando se venda la cuerda esta dada 
por X, donde X = 50-2 Y- Y 2 . Encuentre la utilidad esperada por pie. 

El propietario de una tienda ha abarrotado cierto articulo y decide usar la siguiente promotion para dis- 
minuir la oferta. El articulo tiene un precio marcado de $ 100. Por cada cliente que compre el articulo du¬ 
rante un dfa en particular, el propietario reducira el precio en un factor de un medio. Entonces, el primer 
cliente pagara $50 por el articulo, el segundo pagara $25 y asf sucesivamente. Suponga que el numero de 
clientes que compren el articulo durante el dfa tiene una distribucion de Poisson con media 2. Encuentre 
el costo esperado del articulo al final del dfa. [Sugerencia: el costo al final del dfa es 100(1/2) y . donde 
Y es el numero de clientes que han comprado el articulo.] 

Un fabricante de alimentos usa una maquina de moldeo por inyeccion (que produce galletas del tamano 
de un bocado y botanas) que proporciona un ingreso para la empresa a razon de $200 por hora cuando 
esta en operation. No obstante, la maquina se descompone a un promedio de dos veces por cada dfa que 
trabaja. Si Y denota el numero de descomposturas por dfa, el ingreso diario generado por la maquina es 
R = 1600 - 50L 2 . Encuentre el ingreso diario esperado por usar la maquina. 

Denote con p{y) la funcion de probabilidad asociada con una variable aleatoria de Poisson con 
media A. 

p(y) _ A 

a Demuestre que la relation entre probabilidades sucesivas satisface la igualdad ———— — — , para y — 


b ^Para que valores de y es p(y) > p{y - 1)? 
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3.143 

3.144 


3.9 


DEFINICION 3.12 


DEFINICION 3.13 


c Observe que el resultado del inciso a implica que las probabilidades de Poisson aumentan por un 
tiempo cuando y aumenta y disminuyen de ahf en adelante. Demuestre que p( v) es maximizada cuan- 
do y — al maximo entero menor o igual que A. 

Consulte el Ejercicio 3.142 c. Si el numero de llamadas telefonicas al departamento de bomberos, Y, en 
un dfa tiene una distribucion de Poisson con media de 5.3, ^cual es el numero mas probable de llamadas 
telefonicas al departamento de bomberos en cualquier dfa? 

Consulte los ejercicios 3.142 y 3.143. Si el numero de llamadas telefonicas al departamento de bombe¬ 
ros, Y, en un dfa tiene una distribucion Poisson con media 6, demuestre que p( 5) = p( 6) de modo que 5 
y 6 son los dos valores mas probables para Y. 


Momentos y funciones generadoras 
de momento 

Los parametros p y <r son medidas descriptivas numericas significativas que ubican el centro 
y describen la dispersion asociada con los valores de una variable aleatoria Y, pero no dan 
una caracterizacion unica de la distribucion de Y. Muchas distribuciones diferentes poseen 
las mismas medias y desviaciones estandar. A continuacion consideramos un conjunto de 
medidas descriptivas numericas que (al menos en ciertas condiciones) determinan p(y) 
de manera unica. 


El A-esimo momento de una variable aleatoria Y tomada alrededor del origen se define 
como E(Y k ) y se denota con p' k . 


Observe en particular que el primer momento alrededor del origen es E(Y)=p' l = p y que 
p' 2 = E(Y 2 ) se emplea en el Teorema 3.6 para hallar a 2 . 

Otro momento util de una variable aleatoria es el tornado alrededor de su media. 


El A-esimo momento de una variable aleatoria Y tornado alrededor de su media o el 
A-esimo momento central de Y, se define como E[( Y - p) k \ y esta denotado por p k . 


En particular, cr = p 2 . 

Concentremos nuestra atencion en los momentos p). alrededor del origen donde 
A = 1, 2, 3, . . . Suponga que dos variables aleatorias Y y Z poseen momentos finitos con 
P ] y = I 1 1 y: M 2 y = A^Z’ ■ ■ ■' ri/Y = EjZ , donde j puede tomar cualquier valor entero. Esto 
es, las dos variables aleatorias poseen momentos correspondientes identicos alrededor del ori¬ 
gen. En algunas condiciones mas bien generales, se puede demostrar que Yy Z tienen distribu¬ 
ciones de probabilidad identicas. Asi, un uso importante de los momentos es para calcular la 
distribucion de probabilidad de una variable aleatoria (por lo general un estimador o tomador 
de decisiones). Por tanto, los momentos p' k ., donde k = 1, 2, 3, ... , son principalmente de 
valor teorico para k > 3. 

Otra expectativa interesante es la funcion generadora de momento para una variable aleatoria, 
que hablando en forma figurada, compacta todos los momentos para una variable aleatoria en 
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DEFINICION 3.14 


TEOREMA 3.12 


Demostracion 


una sola expresion. Definiremos primero la funcion generadora de momento y luego vamos a 
explicar la fonna en que trabaja. 


La funcion generadora de momento m(t ) para una variable aleatoria Y se define como 
m(t ) = E(e' Y ). Decimos que una funcion generadora de momento para Y existe si existe 
una constante positiva b tal que m(t) es finita para 1 1 | < b. 


( ',Por que E(e' Y ) recibe el nombre de, funcion generadora de momento para Y1 De una ex¬ 
pansion de serie para e ty , tenemos 

e‘> = l + ty + ^ + ^ + ^ + -. 

2! 3! 4! 

Entonces, suponiendo que p '< es finita para k = 1, 2, 3,..., tenemos 


E(e tY ) = J2e >y P(y) = Y, 


y 


( ty ) 2 (fy ) 3 

1 +ty + +• 


p(y) 


2! 3! 

2 3 

+1 J2 yp(y) + y2 p (y) + y2, p( y) 


2 ! 

y y y 

t 2 t 3 

= i + tp | + —p'l + ffP'i —• 


+ • ■ ■ 


Este argumento comprende un intercambio de sumatorias, que es justificable si m(t ) existe. 
Entonces, E{e ,Y ) es una funcion de todos los momentos p\ alrededor del origen, para k = 1,2, 
3,... . En particular, p\ es el coeficiente de t k /k\ en la expansion de serie de m(t). 

La funcion generadora de momento posee dos aplicaciones importantes. Primero, si pode- 
mos hallar E(e lY ), podemos hallar cualquiera de los momentos para Y. 


Si m(t) existe, entonces para cualquier entero positivo k, 

d k m(t ) 


dt k 


= m ,k >(0) = p' k . 


J/=o 


En otras palabras, si el estudiante encuentra la /.'-esima derivada de m(t) con respecto 
a t y luego hace t = 0, el resultado sera pk 


d k m(t)/dt k , o m a \t), es la A:-esima derivada de m(t) con respecto a t. Como 

t 1 t 3 

m(t) = E(e' Y ) = 1 + tp\ + —p' 2 + — p' 3 + ■ ' % 

se deduce que 

m w {t) = p x + —p 2 + —^ 3 + ■ • % 
m a \t) = p 2 + —p' 3 + -jpp'i + ’ "> 
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y, en general, 

2 1 3t 2 

m (k \t ) = (i' k + —/4 +1 + 2 + • • 

Si hacemos t = 0 en cada una de las derivadas anteriores, obtenemos 

rn (1, (0) = /xj, rn (2) ( 0) = /j- 2 , 

y, en general, 

w w (0) = 

Estas operaciones implican intercambiar derivadas y sumas infinitas, que se pueden 
justificar si existe m(t). 

EJEMPLO 3.23 

Encuentre la funcion generadora de momento m(t ) para una variable aleatoria con distribution 
de Poisson y media A. 

Solucion 

m(t) ~ E(e ,Y ) ~ ^ e ,y p(y ) - ( 

y=0 y=0 

V' —a V' ( A «') y 

“2- y 1 2- v. ■ 

y=0 y=0 y ' 

Para completar la sumatoria, consulte el Apendice A 1.11 para hallar la expansion de la serie 
de Taylor 

V (Agf)y - .A,' 

A? y! 

y=0 y 

o utilice el metodo del Teorema 3.11. Asr, multiplique y divida por e . Entonces 

U y [ 

La cantidad a la derecha del signo de sumatoria es la funcion de probabilidad para una variable 
aleatoria de Poisson con media Ae 1 . Asr, 

= 1 y m(t) = e~ K e Xe '( 1) = g 

y 


Los calculos en el Ejemplo 3.23 no son mas diffciles que los del Teorema 3.11, donde solo 
se calculo el valor esperado para una variable aleatoria Y de Poisson. La evaluation directa de 
la varianza de Y por medio del uso del Teorema 3.6 requirio que E(Y 2 ) se hallara al sumar otra 
serie [en realidad, obtuvimos E(Y 2 ) de E[Y(Y - 1)] en el Ejercicio 3.138]. El Ejemplo 3.24 
ilustra el uso de la funcion generadora de momento de la variable aleatoria de Poisson para 
calcular su media y su varianza. 
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EJEMPLO 3.24 Use la funcion generadora de momenta del Ejemplo 3.23 y el Teorema 3.12 para hallar la 
media, /jl, y la varianza, a 2 , para la variable aleatoria de Poisson. 


Solucion De acuerdo con el Teorema 3.12, p = p! x = m l 1 TO) y jx' 2 = m (2 \ 0). Evaluando la primera 
y segunda derivadas de m(t), obtenemos 

m m (t) = 

dt 

= = \e'] 

at 1 dt 

= e He '- l) ■ (\e‘) 2 + e A(e '- 1) ■ \e'. 

Entonces, como 

/jl = m (1) (0) = |e A(f,_1) A e' Jj = A, 

H' 2 =m (2 \ 0) = {e A(e ‘ _1) . (Ae f ) 2 + e A(e ' _1) . Ae f JJ q =A 2 + A, 

el Teorema 3.6 nos dice que a 2 = E(Y 2 ) — /jl 2 = /T-, — /jl 2 = A 2 + A — (A) 2 = A ■ Observe con 
que facilidad obtuvimos P4 a partir de m(t). ■ 


La segunda aplicacion (pero primaria) de una funcion generadora de momento es demostrar 
que una variable aleatoria posee una distribution de probabilidad particular p(y). Si m(t) existe 
para una distribution de probabilidad /Ay), es unica. Tambien, si las funciones generadoras de 
momento para dos variables aleatorias Ty Z son iguales (para toda \t\ < b para alguna b > 0), 
entonces Y y Z deben tener la misma distribution de probabilidad. Se deduce que, si podemos 
reconocer la funcion generadora de momento de una variable aleatoria Y como una asociada 
con una distribution espetifica, entonces Y debe tener esa distribution. 

En resumen, una funcion generadora de momentos es una expresion matematica que en 
ocasiones (pero no siempre) proporciona una forma facil de hallar momentos asociados con 
variables aleatorias. Lo mas importante es que puede usarse para establecer la equivalencia de 
dos distribuciones de probabilidad. 


EJEMPLO 3.25 Suponga que Tes una variable aleatoria con funcion generadora de momento my(t) = e 3.2(V-i) 

/,Cual es la distribution de Y1 

Solucion En el Ejemplo 3.23 demostramos que la funcion generadora de momento de una variable 
aleatoria con distribution de Poisson y media A es m(t) = e K<,J Observe que la funcion 
generadora de momento de Y es exactamente igual a la funcion generadora de momento de 
una variable aleatoria con distribution de Poisson y A = 3.2. Como las funciones generadoras 
de momento son unicas, Y debe tener una distribution de Poisson con media 3.2. ■ 
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3.145 

3.146 

3.147 

3.148 

3.149 

3.150 

3.151 

3.152 

3.153 

3.154 

3.155 

3.156 

3.157 


Ejercicios 


Si Y tiene una distribucion binomial con n intentos y probabilidad de exito p, demuestre que la funcion 
generadora de momenta para Y es 

m(t) = (pe‘ + q) n , donde q = 1 —p. 

Derive la funcion generadora de momento del Ejercicio 3.145 para hallar E(Y) y E(Y 2 ). Entonces en- 
cuentre V(Y). 

Si Y tiene una distribucion geometrica con probabilidad de exito p, demuestre que la funcion generadora 
de momento para Y es 

pe' 

m(t) = -, donde q = 1 — p. 

1 — qe' 

Derive la funcion generadora de momento del Ejercicio 3.147 para hallar E(Y) y E{Y 2 ). Entonces en- 
cuentre V(Y). 

Consulte el Ejercicio 3.145. Use la unicidad de las funciones generadoras de momento para dar la dis¬ 
tribucion de una variable aleatoria con funcion generadora de momento m(t) = (,6e f + .4) 3 . 


Consulte el Ejercicio 3.147. Use la unicidad de las funciones generadoras de momento para dar la dis- 

,3e' 

tribucion de una variable aleatoria con funcion generadora de momento m(t) =-. 

1 — ,le‘ 

Consulte el Ejercicio 3.145. Si Y tiene una funcion generadora de momento m(t) = (,7e' + ,3) 10 , fcual 
esP(E< 5)? 

Consulte el Ejercicio 3.23. Si Y tiene una funcion generadora de momento m(t) = e 6<e'-i), ^,cual es P(\Y 
- Ml ^ 2o-j? 

Encuentre las distribuciones de las variables aleatorias que tienen cada una de las siguientes funciones 
generadoras de momento: 


a m{t) = [(l/3)e' +(2/3)] 5 . 


c m(t) = e 2( - e ' 11 . 

Consulte el Ejercicio 3.153. Por inspeccion obtenga la media y la varianza de las variables aleatorias 
asociadas con las funciones generadoras de momento dadas en los incisos a, b y c. 

Sea m(t) = (l/6)e f + (2/6)e 2 ' + (3/6)e 3 '. Encuentre lo siguiente: 
a E( Y). 
b V(Y). 

c La distribucion de Y. 

Suponga que Y es una variable aleatoria con una funcion m(t) generadora de momento. 
a ^,Cual es m{ 0)? 

b Si W = 3E demuestre que la funcion generadora de momento de W es m(3t). 
c Si X = Y— 2, demuestre que la funcion generadora de momento de X es e~ 2 'm(f). 

Consulte el Ejercicio 3.156. 

a Si W = 3 Y, use la funcion generadora de momento de W para demostrar que E{W) = 3E(Y) y V(W) 
= 9V(Y). 

b Si X = Y— 2, use la funcion generadora de momento de X para demostrar que E(X) = E(Y) - 2 y V(X) 
= V(Y). 
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3.158 Si Y es una variable aleatoria con funcion generadora de momenta m{t) y si W esta dada por W = aY 
+ b, demuestre que la funcion generadora de momento de W es e ,b m(at). 

3.159 Use el resultado del Ejercicio 3.158 para demostrar que, si W = aY + b, entonces E(W) = aE(Y) + by 
V{W) = a 2 V{Y). 

3.160 Suponga que Y es una variable aleatoria binomial basada en n intentos con probabilidad de exito p y sea 
Y\W) = n — Y. 

a Use el resultado del Ejercicio 3.159 para demostrar que E(Y *) = nq y V(Y*) = npq, donde 
q = 1 ~P- 

b Use el resultado del Ejercicio 3.158 para demostrar que la funcion generadora de momento de Y* es, 
m*(t) = (qe r + pY n donde q = 1 —p. 

c Con base en su respuesta al inciso b, ^cual es la distribucion de Y*? 

d Si Y se interpreta corno el numero de exitos en una muestra de tamano n, ^cual es la interpretation de 
Y*? 


e Con base en su respuesta al inciso d, ^por que las respuestas a los incisos a, b y c son “obvias”? 


3.161 


* 3.162 

* 3.163 


Consulte los Ejercicios 3.147 y 3.158. Si Y tiene una distribucion geometrica con probabilidad de exito 


p, considere Y* = Y— 1. Demuestre que la funcion generadora de momento de Y* es (m*) = 
de q = 1 —p. 


P 


1 -qt 


, don- 


Sea r(t) = In [m(t)\ y denote con r®(0) a la Uesima derivada de r{t) evaluada para t = 0. Demuestre que 
r (1) (0) = /xj = p. y r (2) (0) = p,' 2 - (/rj) 2 = a 2 - [ Sugerencia: m( 0) = 1.] 

Use los resultados del Ejercicio 3.162 para hallar la media y la varianza de una variable aleatoria de 
Poisson con m(t) = e 5(e -1) . Observe que r(t) es mas facil de derivar que m(t) en este caso. 


3.10 Fu nciones generadoras 

de probabilidad (opcional) 

Una clase importante de variables aleatorias discretas es aquella en la que Y representa una 
cantidad y, en consecuencia, toma valores enteros: Y = 0, 1, 2, 3,... Las variables aleatorias 
binomiales, geometricas, hipergeometricas y de Poisson caen todas en esta clase. Los siguien- 
tes ejemplos dan situaciones practicas que resultan en variables aleatorias de valores enteros. 
Uno, que comprende la teorfa de colas (lineas de espera), se refiere al numero de personas (u 
objetos) que esperan servicio en un punto particular en el tiempo. El conocimiento del compor- 
tamiento de esta variable aleatoria es importante para el diseno de plantas de manufactura en 
donde la produccion consiste en una secuencia de operaciones, cada una de ellas tomando un 
tiempo diferente para completarse. Un numero insuficiente de estaciones de servicio para 
una operacion particular de produccion puede resultar en un cuello de botella, la formacion 
de una cola de productos que esperan recibir servicio y en la reduccion en la operacion de 
manufactura. La teorfa de colas es tambien importante para determinar el numero de cajeras 
para un supermercado y para disenar hospitales y clfnicas. 

Las variables aleatorias de valores enteros tambien son importantes en estudios de creci- 
miento de poblacion. Por ejemplo, algunos epidemiologos estan interesados en el crecimien- 
to de poblaciones de bacterias y el crecimiento del numero de personas afectadas por una 
enfermedad en particular. Los numeros de elementos en cada una de estas poblaciones son 
variables aleatorias de numero entero. 
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DEFINICION 3.15 


DEFINICION 3.16 


TEOREMA 3.13 


Demostracion 


Un procedimiento matematico util para hallar las distribuciones de probabilidad y otras 
propiedades de variables aleatorias de valor entero es la funcion generadora de probabilidad. 


Sea Y una variable aleatoria de valor entero para la cual P(Y = i ) = p t , donde i = 0, 1, 
2,... . La funcion generadora de probabilidad Pit) para Y se define como 


P(t) = E(t Y ) = p 0 + pit + p 2 t 2 + • • • = £>■*' 

i —0 


para todos los valores de t tales que Pit) sea finita. 


La razon para llamar a Pi t) una funcion generadora de probabilidad es clara cuando com- 
paramos P(t) con la funcion generadora de momento m(t ). En particular, el coeficiente de t l 
en Pit) es la probabilidad p t . De manera correspondiente, el coeficiente de t' para m(t) es una 
constante multiplicada por el /-esimo momento /j.'. Si conocemos Pit) y podemos expandirlo 
en una serie, podemos determinar piy) como el coeficiente de f. 

La derivacion repetida de P(t) da momentos factorials para la variable aleatoria Y. 


El A:-esimo momento factorial para una variable aleatoria Y se define como 
P-[k] = E[Y{Y — \)(Y — 2) ■ ■ -(Y — k + 1)], 

donde k es un entero positivo. 


Notese que p. m = E(Y) = p.. El segundo momento factorial, pt [2] = E[Y(Y - 1)], fue util 
para hallar la varianza para variables aleatorias binomiales, geometricas y de Poisson en el 
Teorema 3.7, el Ejercicio 3.85 y el Ejercicio 3.138, respectivamente. 


Si Pit) es la funcion generadora de probabilidad para una variable aleatoria de valor 
entero, Y, entonces el Lesimo momento factorial de Y esta dado por 


d k P(t) 

dt k 


t = 1 




Como 


P(t) = p 0 + pit + p 2 t 2 + p 2 t 3 + p 4 t 4 + ■■■, 


se deduce que 

P {1 \t) = ——— = pi + 2p 2 t + 3p 2 t 2 + Ap 4 t 2 + • ■ •, 
dt 

P (2 \f) = = (2)( L)p 2 + (3)(2 ) P3 t + (4)(3 ) P4 t 2 + ■■■, 
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y, en general, 

d k Pit ) 00 

P (k \t) = = J2 y(y - 1)( ^ - 2) ■ • • (y - k + 1 )p(y)t y ~ k . 

y=k 

Haciendo t = 1 en cada una de estas derivadas, obtenemos 

P w (l) — P \ +2 Pl + 3p 3 +4p 4 + ■■■=ii [1] = E(Y), 

P (2 \ 1) = (2)(1)P2 + (3)(2) jP3 + (4)(3)p 4 + ' • • =/X[ 2 ] = £[F(F - 1)], 

y, en general, 

OO 

^0) = y(y - 1)( ^ - 2 ) • • <y - k + Dp(y) 

y=k 

= E[Y(Y - 1 )(F - 2) • ■ -(Y - k + 1)] = /i W . 

EJEMPLO 3.26 

Encuentre la funcion generadora de probabilidad para una variable aleatoria geometrica. 

Solucion 

Observe que p 0 = 0 porque 7 no puede tomar este valor. Entonces 

OO OO 

p(t) = E{t v ) = 'Y^t y q y ^ x p = J2~(qty 

y=l y=l q 

= -[qt + ( qt ) 2 + (qt) 3 + ■•■]. 
q 

Los terminos de la serie son los de una progresion geometrica infinita. Si qt < 1, entonces 

^=-{y ,)=/',• »<<>/«■ 

q \1 — qt / 1 — qt 

(Para la sumatoria de la serie, consulte el Apendice A1.11.) ■ 


EJEMPLO 3.27 

Use P(t), Ejemplo 3.26, para hallar la media de una variable aleatoria geometrica. 

Solucion 

Del Teorema 3.13, p m = p = P ,A) {\). Usando el resultado del Ejemplo 3.26, 

pii) (t) _ d ( P f \ _ O ~qt)p ~(pt)(-q) 
dt \1 — qt) (1— qt) 2 

Haciendo t = 1, obtenemos 


p(l) (1) _ P 2 + pq _ p(p+q) _ 1 u 

P 2 P 2 P 
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Como ya tenemos la funcion generadora de momento para ayudar a hallar los momentos 
de una variable aleatoria, ^de que valor es P(t)l La respuesta es que puede ser dificil encontrar 
m(t ) pero es mucho mas facil hallar P(t). Entonces, Pit) da una herramienta adicional para 
obtener los momentos de una variable aleatoria. Puede o no ser util en una situacion determi- 
nada. 

Hallar los momentos de una variable aleatoria no es el principal uso de la funcion genera¬ 
dora de probabilidad. Su principal aplicacion esta en deducir la funcion de probabilidad (y por 
tanto la distribucion de probabilidad) para otras variables aleatorias de valor entero relaciona- 
das. Para estas aplicaciones, vea la obra de Feller (1968) y Parzen (1992). 


Ejercicios 

* 3.164 Denote con Y una variable aleatoria binomial con n intentos y probabilidad de exito p. Encuentre la 
funcion generadora de probabilidad para Y y usela para hallar E{Y). 

* 3.165 Denote con Y una variable aleatoria de Poisson con media A. Encuentre la funcion generadora de proba¬ 
bilidad para Y y usela para hallar E{Y) y V(Y). 

* 3.166 Consulte el Ejercicio 3.165. Use la funcion generadora de probabilidad hallada en el para encontrar 
E(Y 3 ). 


3.11 Teorema de Tchebysheff 

Hemos visto en la Seccion 1.3 y el Ejemplo 3.22 que si la probabilidad o histograma poblacional 
tiene forma aproximada de campana y se conocen la media y la varianza, la regia empfrica es de 
gran ayuda para calcular las probabilidades de ciertos intervalos. No obstante, en muchos casos, 
las formas de los histogramas de probabilidad diberen marcadamente de la de un montfculo y la 
regia empfrica puede no dar aproximaciones utiles a las probabilidades de interes. El siguiente 
resultado, conocido como teorema de Tchebysheff, se puede usar para determinar un lfmi 
te inferior para la probabilidad de que la variable aleatoria Y de interes caiga en un intervalo 
p, ± kcr. 

TEOREMA 3.14 Teorema de Tchebysheff Sea Y una variable aleatoria con media /jl y varianza finita 
a 2 . Entonces, para cualquier constante k > 0, 

P(\Y'*rfi\ <ka) >1 — ^ o P(|F| m |>M^. 


Deben senalarse dos aspectos importantes de este resultado. Primero, el resultado se aplica a 
cualquier distribucion de probabilidad, ya sea que el histograma de probabilidad tenga forma 
de campana o no. En segundo termino, los resultados del teorema son muy conservadores en el 
sentido de que la probabilidad real de que Y este en el intervalo j± ± kcr por lo general excede 
del lfmite inferior para la probabilidad, 1-1 /k 2 , por una cantidad considerable. No obstante, 
como dijimos en el Ejercicio 3.169, para cualquier k> 1, es posible construir una distribucion 
de probabilidad tal que, para esa k, el lfmite provisto por el teorema de Tchebysheff se alcance 
en realidad. (El estudiante debe verificar que los resultados de la regia empfrica no contradi- 
gan a los dados por el Teorema 3.14.) La prueba de este teorema se deja hasta la Seccion 4.10. 
La utilidad de este teorema queda ilustrada en el siguiente ejemplo. 
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EJ EMPLO 3.28 El numero de clientes por dfa en un mostrador de ventas, Y, ha sido observado durante un largo 
periodo y se encontro que tiene una media de 20 y desviacion estandar de 2. La distribucion 
de probabilidad de Y no se conoce. /,Que se puede decir acerca de la probabilidad de que, 
manana, Y sea mayor que 16 pero menor que 24? 

Solucion Deseamos hallar P( 16 < Y < 24). Del Teorema 3.14 sabemos que, para cualquier k > 0, 
P(\Y -fi\ < kef) >1-1 /k 1 o, 


P[( [jl — kcr) <Y< (/JL + ko-)] > 1 - 


1 


Como fi 


20 y cr = 2, se deduce que /l- kcr = 16 y /jl + &cr = 24 si k = 2. Entonces, 


P(16<Y <24) 


P(/jl — 2a < Y </Lt + 2cr) > 1 — 


1 

w 


3 

4' 


En otras palabras, el total de clientes de manana sera entre 16 y 24 con una probabilidad mas 
bien alta (al menos 3/4). 

Notese que si cr fuera 1, k serfa 4, y 

1 15 

P(16 <Y < 24) = P(ji -4cr< Y < /jl + 4a) > 1 - ^ = —. 


En consecuencia, el valor de cr tiene un efecto considerable sobre las probabilidades asociadas 
con intervalos. ■ 


Ejercicios 

3.167 Sea Y una variable aleatoria con media 11 y varianza 9. Usando el Teorema de Tchebysheff, encuentre 
a un lfmite inferior para P (6 < Y < 16), 

b el valor de C tal que P(\Y - 111 a C) £ .09. 

3.168 Que preferirfa, ^hacer un examen de opcion multiple o uno ordinario? Si no sabe nada del material del 
examen, obtendra una calificacion de cero en uno ordinario. No obstante, si se le dan 5 opciones por 
cada pregunta de seleccion multiple, tiene al menos una probabilidad en cinco de adivinar cada respues- 
ta correcta. Suponga que un examen de opcion multiple contiene 100 preguntas, cada una con 5 posibles 
respuestas y supone la respuesta de cada una de las preguntas. 

a ^,Cual es el valor esperado del numero Y de preguntas que seran contestadas correctamente? 
b Encuentre la desviacion estandar de Y. 
c Calcule los intervalos /jl ± 2a y /jl ± 3a. 

d Si los resultados del examen son curvados de modo que 50 respuestas correctas ameritan una califi¬ 
cacion de aprobacion, ^es probable que reciba una calificacion aprobaria? Explique. 

3.1 69 Este ejercicio demuestra que, en general, los resultados dados por el teorema de Tchebysheff no se pue- 
den mejorar. Sea Y una variable aleatoria tal que 


P(-1) 


1 

18 ’ 


16 

p( 0) = —, 
y 18 


Pi 1) 


1 

18'. 
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a Demuestre que E(Y) = 0 y V(Y) = 1 /9. 

b Use la distribucion de probabilidad de Y para calcular P(\Y - p\ S 3cr). Compare esta probabilidad 
exacta con el lfmite superior dado por el teorema de Tchebysheff para ver que el lfmite dado por 
dicho teorema se alcanza en realidad cuando k = 3. 

*c En el inciso b garantizamos que E( Y) = 0 al poner toda la masa de probabilidad en los valores -1, 0 
y 1, con p(- 1) = p( 1). La varianza fue controlada por las probabilidades asignadas a p{- 1) y p( 1). 
Usando esta misma idea basica, construya una distribucion de probabilidad para una variable aleato- 
riaX que dara P( \X - p, x \ a 2 cr x ) = 1 /4. 

*d Si se especifica cualquier k > 1, ^como puede construirse una variable aleatoria W de modo que P(\W 
~ Vw I - k(T w) = 1 A 2? 

3.170 La Casa de Moneda de Estados Unidos produce monedas de diez centavos, las cuales tienen un diametro 
promedio de .5 pulgadas y desviacion estandar .01. Mediante el teorema de Tchebysheff encuentre un 
lfmite inferior para el numero de monedas de un lote de 400 que se espera tengan un diametro entre .48 
y .52. 

3.171 Para cierto tipo de suelo, el numero de lombrices por pie cubico tiene una media de 100. Suponiendo una 
distribucion de Poisson de las lombrices, proponga un intervalo que incluira al menos 5 /9 de los valores 
muestrales de las cantidades de lombrices obtenida de un numero grande de muestras de 1 pie cubico. 

3.172 Consulte el Ejercicio 3.115. Usando el histograma de probabilidad, encuentre la fraction de valores de 
la poblacion que caiga a no mas de 2 desviaciones estandar de la media. Compare su resultado con el del 
teorema de Tchebysheff. 

3.173 Una moneda balanceada se lanza al aire tres veces. Sea Y igual al numero de caras observado. 

a Use la formula para la distribucion de probabilidad binomial para calcular las probabilidades asocia- 
das con Y = 0. 1, 2 y 3. 

b Construya una distribucion de probabilidad semejante a la de la Tabla 3.1. 

c Encuentre el valor esperado y la desviacion estandar de Y usando las formulas E(Y) = np y 
V(Y)= npq. 

d Usando la distribucion de probabilidad del inciso b, encuentre la fraction de las medidas de pobla¬ 
cion que se encuentren a no mas de 1 desviacion estandar de la media. Repita para 2 desviaciones es¬ 
tandar. ^Como se comparan sus resultados con los del teorema de Tchebysheff y la regia empfrica? 

3.174 Suponga que una moneda estaba definitivamente no balanceada y que la probabilidad de una cara era 
igual ap = .1. Siga las instrucciones a, b, c y d que se expresan en el Ejercicio 3.173. Observe que la 
distribucion de probabilidad pierde su simetrfa y se hace sesgada cuando p no es igual a 1 /2. 

3.175 En mayo de 2005, Tony Blair fue elegido para un historico tercer mandato como primer ministro brita- 
nico. Una encuesta de Gallup del Reino Unido (http:/gallup.com/poll/content/default.aspx?ci = 1710, 
junio 28 de 2005) realizada despues de la election de Blair indico que a solo 32% de los adultos brita- 
nicos les gustarfa ver a su hijo o hija ser primer ministro. Si la misma proportion de estadounidenses 
prefiriera que su hijo o hija fuera presidente y se hubieran entrevistado 120 adultos norteamericanos, 

a ^cual es el numero esperado de estadounidenses que preferirfan que su hijo fuera presidente? 

b ^cual es la desviacion estandar del numero Y que preferirfa que su hijo fuera presidente? 

c ^es probable que exceda de 40 el numero de estadounidenses que preferirfan ver que su hijo fuera 
presidente? 

3.176 Una encuesta nacional de 549 adolescentes (de 13 a 17 anos de edad) realizada por Gallup (http:/gallup. 
com/content/default.aspex?ci= 17110), abril, 2005) indico que 85% “pensaban que la ropa con sfmbo- 
los de pandillas” debfa prohibirse en las escuelas. Si en realidad los adolescentes estuvieran divididos 
por igual en sus opiniones respecto a la prohibition de ropa que lleve sfmbolos de pandillas, comente 
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sobre la probabilidad de observar el resultado de usar esta encuesta (es decir, observar 85% o mas en 
una muestra de 549 que esten a favor de prohibir ropa que lleve sfmbolos de pandillas). ^Que suposi- 
cion debe hacerse acerca del procedimiento de muestreo para calcular esta probabilidad? [Sugerencia: 
recuerde el teorema de Tchebysheff y la regia empirica.] 

3.177 Para cierta seccion de un bosque de pinos, el numero de arboles enfermos por acre, Y, tiene una distri¬ 
bucion de Poisson con media A = 10. Los arboles enfermos son rociados con un insecticida a un costo 
de $3 por arbol, mas un costo fijo general por renta de equipo de $50. Si se denota con C el costo total de 
rociado para un acre seleccionado al azar, encuentre el valor esperado y la desviacion estandar para C. 
^,Dentro de que intervalo espera el lector que se encuentre C con probabilidad de al menos .75? 

3.178 Se sabe que 10% de una marca de tubos electronicos para television se quema antes de que expire su 
garantia. Si se venden 1000 tubos, encuentre el valor esperado y la varianza de Y , el numero de tubos 
originales que deben ser cambiados. ^Dentro de que limites se esperarfa que caiga Y? 

3.179 Consulte el Ejercicio 3.91. En este, determinamos que la media y la varianza de los costos necesarios 
para hallar tres empleados con indicaciones positivas de envenenamiento por asbesto fueron 150 y 4500, 
respectivamente. ^Piensa que es muy poco probable que el costo de completar las pruebas exceda de 
$350? 


3.12 Resumen 

Este capftulo explore las variables aleatorias discretas, sus distribuciones de probabilidad y 
sus valores esperados. El calculo de la distribucion de probabilidad para una variable aleatoria 
discreta requiere el uso de los metodos probabilfsticos del Capftulo 2 para evaluar las proba- 
bilidades de eventos numericos. Las funciones de probabilidad, p(y) = P(Y = y), se obtuvie- 
ron para variables aleatorias binomiales, geometricas, binomiales negativas, hipergeometricas 
y de Poisson. Estas funciones de probabilidad a veces reciben el nombre d e funciones de masa 
de probabilidad , porque dan la probabilidad (masa) asignada a cada uno de los posibles valo¬ 
res finitos o contablemente infinitos para estas variables aleatorias discretas. 

Los valores esperados de variables aleatorias y funciones de variables aleatorias dieron un 
metodo para hallar la media y la varianza de Y y, en consecuencia, medidas de centralidad y 
variation para p(y). Mucho del material restante en el capftulo se dedico a las tecnicas para 
adquirir expectativas, que a veces requerfan sumar series aparentemente diffciles. Las tecnicas 
para obtener expresiones de forma cerrada para algunos de los valores esperados resultantes 
incluyeron (1) usar el hecho de que p(y ) = 1 para cualquier variable aleatoria discreta y 
(2) E(Y 2 ) = E[Y(Y- 1)] + E(Y). Las medias y las varianzas de varias de las distribuciones 
discretas mas comunes se resumen en la Tabla 3.4. Estos resultados y otros se encuentran 
tambien en la Tabla A2.1 del Apendice 2 y al final de este libro. 

La Tabla 3.5 proporciona los procedimientos R (y S-Plus) que dan p(y Q ) = P(Y = y 0 ) y 
P(Y < y 0 ) para variables aleatorias con distribuciones binomiales, geometricas, binomiales 
negativas, hipergeometricas y de Poisson. 

Posteriormente estudiamos la funcion generadora de momento asociada con una variable. 
Aun cuando a veces es util para hallar /r, y cr, la funcion generadora de momento es de valor 
primordial para que el estadfstico teorico obtenga la distribucion de probabilidad de una va¬ 
riable aleatoria. Las funciones generadoras de momento para casi todas las variables aleatorias 
comunes se encuentran en el Apendice 2 y al final de este libro. 
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Tabla 3.4 Medias y varianzas para algunas variables aleatorias discretas comunes 


Distribucion 

E(Y) 

V(Y) 

Binomial 

np 

np( 1 ~ p) = npq 

Geometrica 

i 

i ~ p _ q 


p 

p 2 p 2 

Hipergeometrica 

*(s) 


de Poisson 

A 

A 

Binomial negativa 

r 

r(l — p) rq 

— 



p 

P “ P Z 


Tabla 3.5 Procedimientos K (y S-Plus) que dan probabilidades para algunas distribuciones discretas 
comunes 


Distribucion 

P(Y = y 0 ) = p(y o) 

© 

VI 

Sn 

X 

Binomial 

dbinom(y 0 ,n,p) 

pbinom(y 0 ,n,p) 

Geometrica 

dgeom(y 0 -l,p) 

pgeom (y 0 -l, p) 

Hipergeometrica 

dhyper (y 0 , r, N-r, n) 

phyper (yo , r, N-r, n) 

de Poisson 

dpois (y 0 , A) 

ppois (y 0 ,A) 

Binomial negativa 

dnbinoiti(y 0 -r, r,p) 

pnbinom (y 0 -r,r,p) 


La funcion generadora de probabilidad es un procedimiento util para obtener momentos y 
distribuciones de probabilidad de variables aleatorias de valores enteros. 

Por ultimo, dimos al teorema de Tchebysheff un resultado muy util que permite calcular 
ciertas probabilidades cuando se conocen solo la media y varianza. 

Para concluir este resumen, recordemos el objetivo primordial de estadistica: hacer una 
inferencia acerca de una poblacion con base en informacion contenida en una muestra. Sacar 
la muestra de la poblacion es el experimento. La muestra es en ocasiones un conjunto de 
medidas de una o mas variables aleatorias y es el evento observado resultante de una sola 
repeticion del experimento. Finalmente, hacer la inferencia acerca de la poblacion requiere el 
conocimiento de la probabilidad de que ocurra la muestra observada, que a su vez requiere 
saber las distribuciones de probabilidad de las variables aleatorias que generaron la muestra. 
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Ejercicios complementarios 

3.1 80 Cuatro numeros posiblemente ganadores de una loterfa —AB-4536, NH-7812, SQ-7855 y ZY-3221— 
llegan por correo. Usted gana un premio si uno de sus cuatro numeros es igual a uno de los numeros 
ganadores contenidos en una lista que tienen quienes dirigen la loterfa. Se concede un primer premio 
de $100,000, dos segundos premios de $50,000 cada uno y diez terceros premios de $1000 cada uno. 
Para ser elegible para ganar, es necesario enviar por correo el cupon a la companfa a un costo de 33^ 
por envfo. No se requiere hacer compras. De la estructura de los numeros que se reciban, es obvio que 
los numeros enviados constan de dos letras seguidas de cuatro dfgitos. Suponiendo que los numeros 
recibidos se generaron al azar, ^cudles son las expectativas de que gane la loterfa? ^Merecen la pena los 
33$ para entrar a esta loterfa? 

3.181 El muestreo de piezas defectuosas de grandes lotes de productos manufacturados da un numero de pie- 
zas defectuosas, Y, que sigue una distribucion de probabilidad binomial. Un plan de muestreo consiste 
en especificar el numero de piezas n por incluirse en una muestra y un numero de aceptacion a. El lote 
es aceptado si 7 £ a y rechazado si Y > a. Denote con p la proporcion de piezas defectuosas del lote. 
Para n = 5 y a = 0, calcule la probabilidad de aceptacion del lote si (a) p = 0, (b) p = . 1, (c) p = .3, 
(d) p = .5, (e) p = 1.0. Una grafica que muestra la probabilidad de aceptacion de lote como funcion de la 
fraccion defectuosa del lote se llama curva caracteristica de operacion para el plan muestral. Construya 
la curva caracteristica de operacion para el plan n = 5, a = 0. Observe que un plan de muestreo es un 
ejemplo de inferencia estadfstica. Aceptar o rechazar un lote con base en informacion contenida en la 
muestra es equivalente a concluir que el lote es bueno o malo. "Bueno” implica que una parte pequena 
es defectuosa y que por tanto el lote es apropiado para despacharse, 

3.1 82 Consulte el Ejercicio 3.181. Use la Tabla 1, Apendice 3 para construir las curvas caracterfsticas de ope¬ 
racion para los siguientes planes de muestreo: 

a n = 10, a = 0. 

b n = 10, a = 1. 

c n = 10, a = 2. 

Para cada plan de muestreo, calcule /"(aceptacion de lote) para p = 0, .05 .1, .3, .5, y 1.0. Nuestra in- 
tuicion sugiere que con el plan de muestreo (a) serfa mucho menos probable aceptar lotes malos que 
los planes (b) y (c). Una comparacion visual de las curvas caracterfsticas de operacion confirmara esta 
conjetura intuitiva. 
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3.183 Un ingeniero de control de calidad desea estudiar planes de muestreo altemativos: n = 5, a = 1 y 
n = 25, a = 5. En una hoja de papel para graficar o milimetrico, construya las curvas caracterrsticas de 
operation para ambos planes, haciendo uso de probabilidades de aceptacion en p = .05, p = .10, p = 
.20, p = .30 y p = .40 en cada caso. 

a Si usted fuera un vendedor que produce lotes con una fraccion defectuosa que va de p = 0 ap = .10, 
^cual de los dos planes de muestreo preferirra? 

b Si usted fuera un comprador que desea protegerse contra la aceptacion de lotes con una fraccion 
defectuosa que exceda de p — .30, ^cual de los dos planes de muestreo preferirra? 

3.184 El comisionado de una ciudad dice que 80% de las personas que viven en la ciudad estan a favor de 
la recoleccion de basura por contrato a una empresa privada y no de la recoleccion por empleados del 
municipio. Para probar lo dicho por el comisionado, se seleccionaron al azar 25 residentes de la ciudad, 
dando 22 que prefieren contratar una companfa privada. 

a Si lo dicho por el comisionado es correcto, ^cual es la probabilidad de que la muestra contenga al 
menos 22 que prefieran contratar una compafua privada? 

b Si lo dicho por el comisionado es correcto, ^cual es la probabilidad de que exactamente 22 prefieran 
contratar una companfa privada? 

c Con base en observar 22 en una muestra de 25 que prefieren contratar una companfa privada, r,que 
concluye el lector acerca del dicho del comisionado de que 80% de los residentes de la ciudad prefie¬ 
ren contratar una companfa privada? 

3.185 A veinte estudiantes se les pidio seleccionar un entero entre 1 y 10. Ocho de ellos escogieron ya sea 4, 
5 o 6. 

a Si los estudiantes hacen su selection de manera independiente y es tan probable que cada uno escoja 
uno u otro, ^,cual es la probabilidad de que 8 o mas seleccionen ya sea 4, 5 o 6? 

b Habiendo observado ocho estudiantes que seleccionaron ya sea 4, 5 o 6, f,que conclusion se obtendrfa 
con base en la respuesta al inciso a? 

3.186 Consulte los Ejercicios 3.67 y 3.68. Denote con Y el numero de intento en el que se encuentra el primer 
solicitante con estudios de computacion. Si cada entrevista cuesta $30, encuentre el valor esperado y la 
varianza del costo total en que se incurre al entrevistar candidatos hasta hallar un solicitante con estudios 
avanzados de computacion. ^Dentro de que lfmites se espera caigan los costos de la entrevista? 

3.187 Considere el juego siguiente: un jugador lanza un dado no cargado repetidas veces hasta que obtiene 2, 
3, 4, 5 o 6. En otras palabras, el jugador continua tirando el dado mientras obtenga numeros 1. Cuando 
tira un numero que no es 1, deja de tirar. 

a ^Cual es la probabilidad de que el jugador tire el dado exactamente tres veces? 

b ^Cual es el numero esperado de tiros necesario para obtener el primer numero que no sea 1? 

c Si tira un numero que no es 1 en el primer tiro, el jugador recibe un pago de $1. De otro modo, el 
pago se duplica por cada 1 que el jugador tire antes de tirar otro que no sea 1. Entonces, el jugador 
recibe $2 si tira un 1 seguido de otro que no sea 1; $4 si tira dos numeros 1 seguidos de otro que no 
sea 1; $8 si tira tres numeros 1 seguidos de otro que no sea 1, etcetera. En general, si hacemos que 
Y sea el numero de tiros necesarios para obtener el primero que no sea 1, entonces el jugador tira 
(Y- 1) numeros 1 antes de tirar el primero que no sea 1 y recibe un pago de 2 Y ~ l dolares. ^Cual es la 
cantidad que se espera pagar al jugador? 

3.188 Si Y es una variable aleatoria binomial basada en n intentos y probabilidad de exito p , demuestre que 

1 — (1 — p) n — np( 1 — p)"~ l 


P(Y > 1| Y > 1) 


i ~(i -p\ 
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3.189 Un motor de arranque que se emplea en un vehfculo espacial tiene un alto porcentaje de confiabilidad y 
tiene fama de arrancar en cualquier momento con probabilidad .99999. ^.Cual es la probabilidad de que 
hay a al menos una falla en los siguientes 10,000 arranques? 

3.190 Consulte el Ejercicio 3.115. Encuentre /x, el valor esperado de Y, para la poblacion teorica mediante el 
uso de la distribucion de probabilidad obtenidaen el Ejercicio 3.115. Encuentre la media muestral y para 
las n = 100 mediciones generadas en el Ejercicio 3.116. [,y da una buena estimation de fjcl 

3.191 Encuentre la varianza de la poblacion a 2 para el Ejercicio 3.115 y la varianza muestral s 2 para el Ejercicio 
3.116. Compare. 

3.192 Tire un dado balanceado y sea Y el numero de puntos observados en la cara superior. Encuentre la media 
y la varianza de Y. Construya un histograma de probabilidad y localice el intervalo /x ± 2a. Verifique 
que se cumpla el teorema de Tchebysheff. 

3.193 Dos lmeas de ensamble I y II tienen el mismo porcentaje de piezas defectuosas en su production de regulado- 
res de voltaje. Cinco reguladores se toman como muestra y se prueban en cadalmea. Entre el total de diez re- 
guladores probados, cuatro estan defectuosos. Encuentre la probabilidad de que exactamente dos de los 
reguladores defectuosos provengan de la lmea I. 

3.194 La preocupacion de una jugadora es quedar en bancarrota antes de lograr su primer triunfo. Suponga que 
ellajuega una partida en la que la probabilidad de ganar es .1 (y ella lo desconoce). Le cuesta $10 jugar 
y ella recibe $80 por ganar. Si comienza con $30, ^cual es la probabilidad de que gane exactamente una 
vez antes de perder su capital inicial? 

3.195 El numero de imperfecciones en el tejido de cierto textil tiene una distribucion de Poisson con una media 
de 4 por yarda cuadrada. Encuentre la probabilidad de que 

a una muestra de 1 yarda cuadrada contenga al menos una imperfection, 

b una muestra de 3 yardas cuadradas contenga al menos una imperfection. 

3.196 Consulte el Ejercicio 3.195. El costo de reparar las imperfecciones en el tejido es $10 por imperfection. 
Encuentre la media y la desviacion estandar del costo de reparation para un rollo de 8 yardas cuadradas 
del textil. 

3.197 El numero de colonias de cierto tipo de bacterias en muestras de agua contaminada tiene una distribu¬ 
tion de Poisson con una media de 2 por centfmetro cubico (cm 3 ). 

a Si cuatro muestras de 1 cm 3 se seleccionan de esta agua de manera independiente, encuentre la pro¬ 
babilidad de que al menos una contenga una o mas colonias de bacterias. 

b ^Cuantas muestras de 1 cm 3 deben seleccionarse para tener una probabilidad de aproximadamente 
.95 de ver al menos una colonia de bacterias? 

3.198 Un modelo para competencia de plantas supone que hay una zona de agotamiento de recursos alrededor 
de cada planta. Dependiente del tamano de las zonas y la densidad de las plantas, las zonas de agota¬ 
miento de recursos pueden traslaparse con las de otras plantas en las cercanfas. Cuando las semillas 
se dispersan al azar sobre un lugar amplio, el numero de vecinos que cada planta tiene dentro de un area de 
tamano A suele seguir una distribucion de Poisson con media igual a A X d, donde cl es la densidad 
de plantas por unidad de area. Suponga que la densidad de plantas es cuatro por metro cuadrado. ^Cual es 
la probabilidad de que una planta especificada 

a no tenga vecinos en no mas de un metro?, 

b tenga al menos tres vecinos en no mas de 2 metros? 

3.199 La diabetes dependiente de insulina (IDD, por sus siglas en ingles) es una enfermedad cronica comun 
en ninos. La enfermedad se presenta con mas frecuencia en ninos descendientes de europeos del norte, 
pero la incidencia va de una baja de 1-2 casos por 100,000 por ano a una alta de mas de 40 casos por 
100,000 en algunas partes de Finlandia. 4 Supongamos que una region en Europa tiene una incidencia de 
30 casos por 100,000 por ano y que al azar seleccionamos 1000 ninos de esta region. 
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a ^La distribucion del numero de casos de IDD entre los de la muestra puede ser aproximada por una 
distribucion de Poisson? Si es asl, ^cual es la media de la aproximacion de distribucion de Poisson? 

b ^Cual es la probabilidad de que observemos al menos dos casos de IDD entre los 1000 ninos de la 
muestra? 

3.200 Usando el dato de que 


= 1 + z + — + — + — + 

2! 3! 4! 

expanda la funcion generadora de momento para la distribucion binomial 

m(t) =(q+ pe'Y 


en una serie de potencias en t. (Tome en cuenta solo los terminos de orden inferior en t.) Identifique p- \ 
como el coeficiente de t'/H que aparece en la serie. Especlficamente, encuentre p.\ y p-\ y comparelas 
con los resultados del Ejercicio 3.146. 

3.201 Consulte los Ejercicios 3.103 y 3.106. ^En que intervalo esperarfa encontrar los costos de reparation en 
estas cinco maquinas? (Use el teorema de Tchebysheff.) 

*3.202 El numero de autos que pasan por una zona de estacionamiento en un intervalo de un minuto tiene una 
distribucion de Poisson con media A. La probabilidad de que cualquier conductor individual desee esta- 
cionar su auto es p. Suponga que las personas decidan estacionarse de modo independiente entre si. 

a Si hay un lugar de estacionamiento y tomara 1 minuto llegar ahl, ^cual es la probabilidad de que el 
lugar este disponible cuando la persona llegue al lote? (Suponga que nadie sale del lote durante 
el intervalo de un minuto.) 

b Denote con W el numero de conductores que deseen estacionarse durante un intervalo de un minuto. 
Deduzca la distribucion de probabilidad de W. 

3.203 Un tipo de celula de bacteria se divide a un ritmo constante de A en el tiempo. (Es decir, la probabilidad 
de que una celula se divida en un intervalo de t mas corto es aproximadamente A t.) Dado que una pobla¬ 
cion inicia en el tiempo cero con k celulas de esta bacteria y que las divisiones celulares son indepen- 
dientes entre si, el tamano de la poblacion en el tiempo t, Y(t), tiene una distribucion de probabilidad 


)e“ Afe (1 - e~ Xr )" \ n = k, k + 1,... 
a Encuentre el valor esperado y la varianza de Y{t) en terminos de A y t. 

b Si, para un tipo de celula de bacteria, A = . 1 por segundo y la poblacion empieza con dos celulas en el 
tiempo cero, encuentre el valor esperado y la varianza de la poblacion despues de cinco segundos. 

3.204 La probabilidad de que cualquier conductor de automovil gire a la izquierda en un crucero es .2. El carril 
de vuelta a la izquierda en este crucero tiene espacio para tres vehlculos. Si el carril de giro a la izquierda 
esta vaclo cuando el semaforo se pone en rojo y cinco vehlculos llegan a este crucero cuando la luz esta 
en rojo, encuentre la probabilidad de que el carril de vuelta a la izquierda contenga los vehlculos de 
todos los conductores que deseen dar vuelta a la izquierda. 

3.205 Un experimento consiste en tirar un dado no cargado hasta que un 6 saiga cuatro veces. ^Cual es la 
probabilidad de que el proceso termine despues de exactamente diez tiros con un 6 saliendo en los tiros 
noveno y decimo? 


(n — 1 

/WO-»] = (*„! 


4. M. A. Atkinson, ’’Diet, Genetics, and Diabetes”, en Food Technology 51(3), (1997): 77. 


Ejercicios complementarios 155 


3.206 

3.207 

3.208 

3.209 
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Los registros de accidentes recolectados por una companfa de seguros de automoviles dan la siguiente 
information. La probabilidad de que un conductor asegurado tenga un accidente automovilfstico es .15. 
Si ha ocurrido un accidente, las averfas al vehfculo ascienden al 20% de su valor comercial con una 
probabilidad de .80, a 60% de su valor comercial con una probabilidad de .12 y a perdida total con 
una probabilidad de .08. ^.Que prima debe cobrar la companfa sobre un auto de $12,000 para que la 
ganancia esperada por la companfa sea cero? 

El numero de personas que entran en la unidad de cuidados intensivos de un hospital en cualquier dfa 
posee una distribucion de Poisson con media igual a cinco personas por dfa. 

a ^Cual es la probabilidad de que el numero de personas que entren en la unidad de cuidados intensivos 
en un dfa particular sea igual a 2? £y que sea menor o igual que 2? 

b ^,Es probable que Y pase de 10? Explique. 

Una encuesta reciente sugiere que los estadounidenses anticipan una reduccion en sus estandares de vida 
y que un nivel cada vez mas creciente de consumo ya no es tan importante como lo fue en el pasado. 
Suponga que una encuesta de 2000 personas indica que 1373 estan a favor de que, por medios legislati¬ 
ves, se obligue a una reduccion en el tamano de los automoviles hechos en Estados Unidos. ^Esperarfa 
observar hasta 1373 personas a favor de esta proposition si, de hecho, el publico general se ha dividido 
en 50 a 50 con respecto a este problema? ^Por que? 

Un proveedor de maquinaria pesada para construction ha encontrado que normalmente se obtienen 
nuevos clientes por medio de solicitudes de estos en llamadas de ventas y que la probabilidad de venta 
de una pieza particular de equipo es .3. Si el proveedor tiene tres maquinas para venta, ^cual es la pro¬ 
babilidad de que se requieran menos de cinco llamadas de clientes para agotar el inventario? 

Calcule P{\Y - A|£ 2cr) para la distribucion de probabilidad de Poisson del Ejemplo 3.22. ^Esto esta de 
acuerdo con la regia empfrica? 

Una comerciante tiene en existencia cierto artfculo perecedero. Ella sabe que en cualquier dfa determi- 
nado tendra una demanda de dos, tres o cuatro de estos artfculos con probabilidades .1, .4 y .5, respec- 
tivamente. Compra los artfculos en $1.00 cada uno y los vende en $1.20 cada uno. Si quedan algunos al 
final del dfa, representan perdida total. ^Cuantos artfculos debe tener en existencia para maximizar su 
utilidad diaria esperada? 

Demuestre que la funcion de probabilidad hipergeometrica se aproxima a la binomial en el lfmite cuan- 
do ?V—» oo y p = r/N permanece constante. Esto es, demuestre que 



parap = r/N constante. 

Un lote de N = 100 productos industriales contiene 40 defectuosos. Sea Y el numero de defectuosos en 
una muestra aleatoria de tamano 20. Encuentre p( 10) con el uso de (a) la distribution de probabilidad 
hipergeometrica y (b) la distribucion de probabilidad binomial. ^Es N suficientemente grande para que 
el valor de p(\ 0) obtenido con de la distribucion binomial sea una buena aproximacion de la obtenida 
usando la distribucion hipergeometrica? 

Por simplicidad, supongamos que hay dos clases de conductores. Los conductores seguros, que son 70% 
de la poblacion, tienen probabilidad . 1 de causar un accidente en un ano. El resto de la poblacion son 
provocadores de accidentes, que tienen una probabilidad .5 de causar un accidente en un ano. La prima 
de seguro es $400 multiplicado por la probabilidad de alguien de causar un accidente en el ano siguiente. 
Un nuevo suscriptor tiene un accidente durante el primer ano. ^Cual debe ser la prima de seguro para 
el ano siguiente? 
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*3.215 Se sabe que 5% de los miembros de una poblacion tienen una enfermedad A, que puede ser descubierta 
por un examen de sangre. Suponga que N (un numero grande) personas se someten al examen. Esto 
puede hacerse en dos formas: (1) Cada persona es examinada por separado o (2) las muestras sangumeas 
de k personas se agrupan y analizan. (Suponga que N = nk, con n un entero.) Si el examen es negativo, 
todos ellos son sanos (es decir, solo se requiere este examen). Si es positivo, cada una de las k personas 
debe ser examinada por separado (es decir, se requiere un total de k + 1 examenes). 

a Para una k fija, ^,cual es el numero esperado de examenes necesario en la opcion 2? 

b Encuentre la k que minimizara el numero esperado de examenes en la opcion 2. 

c Si k se selecciona como en el inciso b, ^,en promedio cuantos examenes ahorra la opcion 2 en com- 
paracion con la opcion 1? 

*3.216 Considere que Y tiene una distribucion hipergeometrica 

or -r ) 

= y =0,1,2 

\n / 

a Demuestre que 

/>(y=»)=p(») = (l)(^) (^|) 

b Escriba p(y ) como p(y\r). Demuestre que si ry < r 2 , entonces 

p(yki) p(y + l|r t ) 

p(y\ri) p(y + \\r 2 ) 

c Aplique la expansion binomial a cada factor de la siguiente ecuacion: 



(1 + 0)^(1 +a) Nl = (1 +a) N ' +Nl . 


Ahora compare los coeficientes de a" en ambos lados para demostrar que 



d Usando el resultado del inciso c, concluya que 


2>oo = 1 - 

* 3.21 7 Use el resultado obtenido en el Ejercicio 3.216 c y la Definicion 3.4 para obtener directamente la media 
de una variable aleatoria hipergeometrica. 

* 3.21 8 Use los resultados de los Ejercicios 3.216 y 3.217 para demostrar que, para una variable aleatoria hiper¬ 
geometrica, 


E[Y(Y - 1)J 


r(r — 1 )n(n — 1) 
N(N ~ 1) 
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4.4 La distribucion de probabilidad uniforme 

4.5 La distribucion de probabilidad normal 
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4.11 Valor esperado de funciones discontinuas y distribuciones mixtas de probabilidad 
(opcional) 

4.12 Resumen 

Bibliograffa y lecturas adicionales 


4.1 Introduccion 

Un momento de reflexion sobre variables aleatorias que se encuentran en el mundo real debe 
convencernos de que no todas las variables aleatorias de interes son discretas. El numero de 
dias que llueve en un periodo de n dias es una variable aleatoria discreta porque el numero 
de dias debe tomar uno de los n + 1 valores 0, 1, 2,.... o n. Ahora considere la lluvia diaria en 
un punto geografico especifico. En teoria, con equipo de medicion de precision perfecta, la can- 
tidad de lluvia podria tomar cualquier valor entre 0 y 5 pulgadas. En consecuencia, cada uno del 
numero incontable e infinito de puntos del intervalo (0, 5) representa un valor posible distinto 
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de la cantidad de lluvia en un dla. Una variable aleatoria que puede tomar cualquier valor en un 
intervalo se denomina continua y el proposito de este capftulo es estudiar distribuciones de pro¬ 
babilidad para variables aleatorias continuas. La production de un antibiotico en un proceso de 
fermentation es una variable aleatoria continua, al igual que la duration de vida util, en anos, 
de una maquina lavadora. Los segmentos de recta sobre los cuales estas dos variables se definen 
estan contenidos en la mitad positiva de la recta real. Esto no significa que, si observamos sufi- 
cientes maquinas lavadoras, podrfamos a la larga observar un resultado correspondiente a cada 
valor del intervalo (3, 7); mas bien, esto significa que ningun valor entre 3 y 7 se puede excluir 
como posible para el numero de anos que una maquina lavadora permanece en servicio. 

La distribucion de probabilidad para una variable aleatoria discreta siempre puede darse al 
asignar una probabilidad no negativa a cada uno de los posibles valores que la variable pueda 
tomar. En todo caso, por supuesto, la suma de todas las probabilidades que asignamos debe 
ser igual a 1. Por desgracia, la distribucion de probabilidad para una variable aleatoria con¬ 
tinua no puede ser especificada en la misma forma. Es matematicamente imposible asignar 
probabilidades diferentes de cero a todos los puntos de un intervalo de recta al tiempo que se 
satisface el requisite de que las probabilidades de los distintos valores posibles ascienden a 1. 
En consecuencia, debemos desarrollar un metodo diferente para describir la distribucion de 
probabilidad para una variable aleatoria continua. 


4.2 Distribucion de probabilidad para 
una variable aleatoria continua 

Antes de que podamos expresar una definicion formal para una variable aleatoria continua, 
debemos definir la funcion de distribucion (o funcion de distribucion acumulativa) asociada 
con una variable aleatoria. 

DEFINICION 4.1 Denote con Y cualquier variable aleatoria. La funcion de distribucion de Y, denotada por 

F(y), es tal que F(y) = P(Y < y) para -oo < y < oo. 


La naturaleza de la funcion de distribucion asociada con una variable aleatoria determina 
si la variable es continua o discreta. En consecuencia, comenzaremos nuestra exposition al 
examinar la funcion de distribucion para una variable aleatoria discreta y tomando nota de las 
caracterfsticas de esta funcion. 


EJ EMPLO 4.1 Suponga que Y tiene una distribucion binomial con n = 2 y p = 1/2. Encuentre F(y). 


Solution La funcion de probabilidad para Y esta dada por 


p(y) = 




y = 0, 1, 2, 


y se obtiene 


p( 0) = 1/4, 


p( 1) = 1/2, p( 2) = 1/4. 
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FIGURA 4.1 
Funcion de distribu¬ 
cion binomial, 

n = 2,p = 1/2 



( ',Cual es F(- 2) = P(Y < -2)? Como los unicos valores de Y a los que se asignan probabilida- 
des positivas son 0, 1 y 2 y ninguno de estos valores son menores o iguales a -2, F(- 2) = 0. Si 
usamos una logica similar, F(y) = 0 para toda y < 0. ( ',C’ual es /-’( 1.5)7 Los unicos valores de 
Y que son menores o iguales a 1.5 y tienen probabilidades diferentes de cero son los valores 
0 y 1. Por lo que, 


En general. 


F( 1.5) = P(Y < 1.5) = P(Y = 0) + P(Y = 1) 
= (1/4) +(1/2) =3/4. 


F(y) = P(Y^y) 


0, para y < 0, 

1 /4, para 0 < y < 1, 
3/4, para 1 < y < 2, 
1, para y > 2. 


Una grafica de F(y) se da en la Figura 4.1. 


En el Ejemplo 4.1, los puntos entre 0 y 1 o entre 1 y 2 tenian todos probabilidad 0 y no con- 
tribuyeron en nada a la probabilidad acumulativa descrita por la funcion de distribucion. En 
consecuencia, la funcion de distribucion acumulativa siguio siendo plana entre los posibles 
valores de Y y aumento en saltos o escalones en cada uno de los posibles valores de Y. Las 
funciones que se comportan de ese modo se denominan funciones escalon. Las funciones de 
distribucion para variables aleatorias discretas son siempre funciones escalon porque la fun¬ 
cion de distribucion acumulativa aumenta solo en el numero finito o contable de puntos con 
probabilidades positivas. 

Como la funcion de distribucion asociada con cualquier variable aleatoria es tal que 
/•Tv) = P(Y < v), desde un punto de vista practico es evidente que Fi-oo) = Ifm, ,_. x Pi Y < v) 
debe ser cero. Si consideramos dos valores cualesquiera vq < y 2 , entonces P(Y < y,) ^ 
P(Y < y 2 ), es decir, /*’(v,) < F(y 2 ). Entonces, una funcion de distribucion. F(y), es siempre una 
funcion monotonica, no decreciente. Ademas, es evidente que F(oo) = Ifm >rx P( Y < y) = 1. 
Estas tres caracterfsticas definen las propiedades de cualquier funcion de distribucion y estan 
resumidas en el siguiente teorema. 
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TEOREMA 4.1 


DEFINICION 4.2 


FICURA 4.2 
Funcion de distribucion 
para una variable 
aleatoria continua 


Propiedades de una funcion de distribucion 1 Si F(y) es una funcion de distribucion, 
entonces 

1. F(— oo) = lim F(y) =0. 

y—* — oo 

2. F(oo) = lim F(y ) = 1. 

y—>oo 

3. F(y) es una funcion no decreciente de y. [Si y, y y 2 son cualesquiera valores de 
manera que y 1 < y 2 , entonces F(yy < F(y 2 ).] 


Usted debera comprobar que la funcion de distribucion desarrollada en el Ejemplo 4.1 tenga 
cada una de estas propiedades. 

Examinemos ahora la funcion de distribucion para una variable aleatoria continua. Suponga 
que, para todos los fines practicos, la cantidad de lluvia diaria, Y, debe ser menor que 6 pulga- 
das. Para todo 0 < yq < y 2 < 6, el intervalo (y ,, y 2 ) tiene una probabilidad positiva de incluir 
Y, sin importar cuanto se acerque y, ay 2 . Se deduce que F(y) en este caso debe ser una funcion 
lisa, creciente sobre algun intervalo de numeros reales, como se grafica en la Figura 4.2. 

Por tanto, llegamos a la definicion de una variable aleatoria continua. 


Una variable aleatoria Y con funcion de distribucion F(y) se dice que es continua si F(y) 
es continua, para -oo < >' < oo. 2 



1. Para ser matematicamente rigurosos, si F(y ) es una funcion de distribucion valida, entonces F(y) tambien debe 
ser continua. 

2. Para ser matematicamente precisos, tambien necesitamos que exista la primera derivada de F(y) y que sea conti¬ 
nua excepto para, a lo sumo, un numero finito de puntos en cualquier intervalo finito. Las funciones de distribucion 
para las variables aleatorias continuas estudiadas en este texto satisfacen este requisito. 
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DEFINICION 4.3 


FIGURA 4.3 
Fa funcion 
de distribucion 


Si y es una variable aleatoria continua, entonces, para cualquier numero real y, 

P(Y = y) = 0. 

Si esto no fuera cierto y P(Y = y 0 ) = p 0 > 0, entonces F(y) tendria una discontinuidad (salto) 
de tamano p 0 en el punto y 0 , violando la suposicion de que Y era continua. Hablando en termi- 
nos practicos, el hecho de que las variables aleatorias continuas tengan probabilidad cero en 
puntos discretos no debe molestarnos. Considere el ejemplo de medir la lluvia diaria. (i Cual 
es la probabilidad de que veamos una medida de lluvia diaria de exactamente 2.193 pulgadas? 
Es bastante probable que nunca observemos ese valor exacto incluso si tomamos medidas 
de lluvia durante toda una vida, aunque podrfamos ver muchos dias con medidas entre 2 y 3 
pulgadas. 

La derivada de F(y) es otra funcion de gran importancia en teorfa de probabilidad y esta- 
dfstica. 


Sea F(y) la funcion de distribucion para una variable aleatoria continua Y. lintonces/(v), 
dada por 


f(y) 


dF(y) 
dy 


F'(y ) 


siempre que exista la derivada, se denomina/nnc/dn de densidad de probabilidad para 
la variable aleatoria Y. 


Se deduce de las Definiciones 4.2 y 4.3 que F(y) se puede escribir como 


F(y) = r fit) dt, 

J — oo 


donde/(-) es la funcion de densidad de probabilidad y t se usa como la variable de integration. 
La relation entre las funciones de distribucion y de densidad se muestra graficamente en la 
Ligura 4.3. 

La funcion de densidad de probabilidad es un modelo tedrico para la distribucion de fre- 
cuencia (histograma) de una poblacion de medidas. Por ejemplo, observaciones de la vida util 
de lavadoras de una marca particular generan mediciones que pueden estar caracterizadas por 
un histograma de frecuencia relativo, como se explica en el Capftulo 1. De manera conceptual, 
el experimento podrfa repetirse hasta el infinito, con lo cual se genera una distribucion de 
frecuencia relativa (una curva suave) que caracterizarfa la poblacion de interes para el fabri- 
cante. Esta distribucion teorica de frecuencia relativa corresponde a la funcion de densidad de 
probabilidad para la duration de vida de una sola maquina, Y. 


fiy) 
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Debido a que la funcion de distribucion F(y) para cualquier variable aleatoria siempre tiene 
las propiedades dadas en el Teorema 4.1, las funciones de densidad deben tener algunas pro- 
piedades correspondientes. Como F(y) es una funcion no decreciente, la derivada/(y) nunca 
es negativa. Ademas, sabemos que F(oo) = 1 y, por tanto, que J 'j f(t)dt = 1. Enresumen, 
las propiedades de una funcion de densidad de probabilidad se dan en el siguiente teorema. 


TEOREMA 4.2 


Propiedades de una funcion de densidad Si f(y) es una funcion de densidad para una 
variable aleatoria continua, entonces 

1. f(y) > 0 para toda y, — oo < y < oo. 

2- P 00 f(y)dy=\. 


El siguiente ejemplo proporciona la funcion de distribucion y la funcion de densidad para 
una variable aleatoria continua. 


EJEMPLO 4.2 Supongaque 


F(y) 


0, para y< 0, 

y, para 0< y < 1, 

1, para y > 1. 


Encuentre la funcion de densidad de probabilidad para Y y graffquela. 


Solucion Como la funcion de densidad/(y) es la derivada de la funcion de distribucion F(y), cuando la 
derivada existe. 


f(y) 


y f(y) no esta definida en y 



0 y y = 1. Una grafica de 


para y < 0, 
para 0 < y < 1, 
para y > 1, 

F(y) se muestra en la Figura 4.4. 



La grafica de f(y) para el Ejemplo 4.2 se muestra en la Figura 4.5. Observe que las funcio¬ 
nes de distribucion y densidad dadas en el Ejemplo 4.2 tienen todas las propiedades requeridas 
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FIGURA 4.5 
Funcion de densidad 
f(y) para el Ejemplo 4.2 


EJEMPLO 4.3 


Solucion 


FIGURA 4.6 
Funcion de densidad 
para el Ejemplo 4.3 



de las funciones de distribucion y densidad, respectivamente. Ademas, F(y) es una funcion 
continua de y, pero f(y) es discontinua en los puntos y = 0, 1. En general, la funcion de distri¬ 
bucion para una variable aleatoria continua debe ser continua, pero la funcion de densidad no 
necesita ser continua en todas partes. 


Sea Y una variable aleatoria continua con funcion de densidad de probabilidad dada por 




3y 2 , 0<y<l, 

0, en cualquier otro punto. 


Encuentre F(y). Graft que/(y) y F(y). 

La grafica de/(y) aparece en la Figura 4.6. Como 

p(y)= r f(t)cit, 

J — oo 

tenemos, para este ejemplo, 


F(y) 


f y _ x Odt =0, paray < 0, 

fl^Odt + / 0 J 3t 2 dt = 0 + f 3 ]^ = y 3 , para 0 < y < 1, 

f 0 ^ Odt + Jq 3 1 2 dt + j y Odt = 0 + t 3 ]g + 0=1, para 1 < y. 


Observe que algunas de las integrales que hemos evaluado conducen a un valor de 0. Estas se 
incluyen para hacer mas completo este ejemplo inicial. En calculos futuros no mostraremos de 
manera explfcita ninguna integral que tenga valor 0. La grafica de F(y) se da en la Figura 4.7. 

Ay) 

3 
2 
1 

o i y ■ 



F(y 0 ) da la probabilidad de que Y < y 0 . Como se vera en los capitulos siguientes, en ocasio- 
nes estamos interesados en determinar el valor, y, de una variable aleatoria Y de manera que P(Y 
< y) iguale o exceda algun valor especificado. 
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F I G U R A 4.7 
Funcion de 
distribucion para el 
Ejemplo 4.3 


DEFINICION 4.4 


TEOREMA 4.3 


F I G U R A 4.8 

P(a <Y<b) 



Denotemos con Y cualquier variable aleatoria. Si 0 <P< 1, el p-esimo cuantil de Y, 
denotado por <p p , es el mmimo valor tal que P (Y < c fi q ) = F (cf> p ) 2= p. Si Y es continua, 
( f> p es el mmimo valor tal que F (<p p ) = P (F < cf> q ) = p. Algunos prefieren llamar (f> 1 , al 
1OOp-esimo percentil de Y. 


Un caso especial importante es p = I /2 y </> 5 es la mediana de la variable aleatoria Y. En 
el Ejemplo 4.3 la mediana de la variable aleatoria es tal que F ((/> 5 ) = .5 y facilmente se ve, que 
(<^> 5 ) 3 = .5, o bien, de manera similar, que la mediana de Y es (f> 5 = (.5)^ 3 = .7937. 

El siguiente paso es hallar la probabilidad de que Y caiga en un intervalo especffico; esto 
es, P{a < Y < b). Del Capftulo 1 sabemos que esta probabilidad corresponde al area bajo 
la distribucion de frecuencia en el intervalo a < y < b. Como/(y) es la similar teorica de la distri¬ 
bucion de frecuencia, podrfamos esperar que P(a < Y < b) fuera igual a un area correspondiente 
bajo la funcion de densidad/(y). Esto de hecho es verdad porque, si a < b, 


P(a <Y <b) = P(Y <b)~ P(Y < a) = F(b) - F(a ) = f f(y ) dy. 


Como P(Y = d) = 0, tenemos el siguiente resultado. 


Si la variable aleatoria Y tiene funcion de densidad/(v) y a < b, entonces la probabili¬ 
dad de que Y caiga en el intervalo [a, /;] es 

P(a<Y<b)= f f(y) dy. 


Esta probabilidad es el area sombreada de la Figura 4.8. 
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Si Y es una variable aleatoria continua y a y b son constantes tales que a < b, entonces 
P(Y = a) = 0 y P(Y = b) = 0 y el Teorema 4.3 implica que 

P(a < Y < b) = P(a < Y < b) = P(a < Y < b ) 

= P( a <Y <b) = f f(y) dy. 

J a 

El hecho de que esta secuencia de igualdades no es, en general, verdadera para variables alea- 
torias discretas se ilustra en el Ejercicio 4.7. 

EJEMPLO 4.4 

Dada /Ty ) = cy 2 , 0 < y — 2 y f(y) = 0 en cualquier otra parte, encuentre el valor de c para el 
cual/(v) es una funcion de densidad valida. 

Solucion 

Requerimos un valor para c de manera que 

/>oo 

F(oo)= f(y)dy= 1 

J — oo 


Entonces, (8/3)c = 1, y encontramos que c = 3/8. ■ 


EJEMPLO 4.5 

Encuentre P(1 < E< 2) para el Ejemplo 4.4. Tambien encuentre P(\ < Y < 2). 

Solucion 

Como Y tiene una distribucion continua, se deduce que P(Y = 1) = P(Y = 2) = 0 y, por tanto, 
que 

P(1 < Y < 2) = P{\ < Y < 2) = y 2 dy = 7 ~. U 


Los enunciados de probabilidad que se refieren a una variable aleatoria continua Y son 
significativos solo si, primero, existe la integral que define la probabilidad y, segundo, que las 
probabilidades resultantes concuerden con los axiomas del Capitulo 2. Estas dos condiciones 
siempre quedaran satisfechas si consideramos solo probabilidades asociadas con un conjunto 
finito o contable de intervalos. Como casi siempre estamos interesados en probabilidades 
en las que las variables continuas caen en intervalos, esta consideracion no nos ocasionara 
dificultad. Algunas funciones de densidad que dan buenos modelos para distribuciones de 
frecuencia poblacional, que se encuentran en aplicaciones practicas, se presentan en seccio- 
nes posteriores. 
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Ejercicios 

4.1 Sea Funa variable aleatoria con p(y) dada en la tabla siguiente. 


y 

12 3 4 

p(y ) 

.4 .3 .2 .1 


4.2 


4.3 


4.4 


4.5 


a Obtenga la funcion de distribucion, F(y). Asegurese de especificar el valor de F(y) para toda y, 

-oo < y < oo. 

b Trace la funcion de distribucion dada en el inciso a. 

Una caja contiene cinco Haves, solo una de las cuales abrira una cerradura. Las llaves se seleccionan al 
azar y se prueban una a la vez hasta que la cerradura se abre (las llaves que no funcionan se descartan 
antes de probar otra). Sea Y el numero de intentos en los que la cerradura se abre. 

a Encuentre la funcion de probabilidad para Y. 

b Obtenga la correspondiente funcion de distribucion. 

c iQueesP(T< 3)?iP(y= 3)? 

d Si Fes una variable aleatoria continua, decimos que, para toda -oo < a < oo, P(Y = a) = 0. ^Alguna 
de las respuestas en el inciso c contradice esta afirmacion? ^Por que? 

Una variable aleatoria de Bernoulli es aquella que toma solo dos valores, 0 y 1 con p{ 1) = p y p(0) = 
1 -p = q. 

a Trace la correspondiente funcion de distribucion. 

b Demuestre que esta funcion de distribucion tiene las propiedades dadas en el Teorema 4.1. 

Sea F una variable aleatoria binomial con n = 1 y probabilidad p de exito. 
a Encuentre la funcion de probabilidad y distribucion para F. 

b Compare la funcion de distribucion del inciso a con la del Ejercicio 4.3(a). ^Que concluye? 

Suponga que F es una variable aleatoria que toma solo valores enteros 1, 2,... y tiene funcion de distri¬ 
bucion F(y). Demuestre que la funcion de probabilidad p(y) = P{Y = y) esta dada por 


p(y) = 


4.6 


F( 1), y = l, 

F(y) ~ F(y — 1), y=2, 3,... 

Considere una variable aleatoria con una distribucion geometrica (Section 3.5); esto es, 


POO =« ,-1 p. 


y = 1, 2, 3,..., 0 <p < 1. 


a Demuestre que F tiene funcion de distribucion F(y) tal que F(i) = 1 - q\ i = 0, 1, 2,... y que, en 
general, 


F{y) = 


0, y < 0, 

1 — q', i£y<i + 1, 


para i = 0, 1, 2,... 


b Demuestre que la funcion de distribucion acumulativa precedente tiene las propiedades dadas en el 
Teorema 4.1. 

4.7 Sea F una variable aleatoria binomial con n = 10 y p = .2. 

a Use la Tabla 1, Apendice 3, para obtener P (2 < F < 5) y P (2 £ F < 5). (.Son iguales las probabili- 
dades de que F caiga en los intervalos (2, 5) y [2, 5)? ^Por que si o por que no? 
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4.8 


b Use la Tabla 1, Apendice 3, para obtener P (2 < 7 < 5) y P (2 £ 7 £ 5). ^Son iguales estas probabi- 
lidades? ^Por que si o por que no? 

c Ya antes en esta section dijimos que si 7 es continua y a < b, entonces P(a < Y <b) = P(a ^ Y < b). 
^E1 resultado del inciso a contradice esta afirmacion? ^,Por que? 


Suponga que Y dene funcion de densidad 


f(y) = 


ky{ 1-y), 0<y<l, 

0, en cualquier otro punto. 


a Encuentre el valor de k que haga de/(y) una funcion de densidad de probabilidad. 
b Encuentre P(. 4 < Y < 1). 
c Encuentre P(. 4 < Y < 1). 
d Encuentre P(Y <.4|7 < .8). 
e Encuentre P (7 < ,4|7 < .8). 


4.9 


Una variable aleatoria 7 tiene la siguiente funcion de distribution: 


F(y) 


0 , 

para y < 2, 

1/8, 

para 2 < y < 2.5, 

3/16, 

para 2.5 ^ y < 4, 

1/2 

para 4 £ y < 5.5, 

5/8, 

para 5.5 £ y < 6, 

11/16, 

para 6 £ y < 7, 

1 , 

para y a 7. 


a ^,Es 7 una variable aleatoria continua o discreta? ^Por que? 
b iQue valores de 7 son probabilidades positivas asignadas? 
c Encuentre la funcion de probabilidad para 7. 
d ^Cual es la mediana, (f> 5 , de 7? 

4.10 Consulte la funcion de densidad dada en el Ejercicio 4.8. 

a Encuentre el cuantil .95, <p 95 , tal que P(Y < ^ 95 ) = .95. 
b Encuentre un valor y 0 de manera que P(Y < y 0 ) = .95. 

c Compare los valores para (f> 95 y _y 0 que obtuvo en los incisos a y b. Explique la relation entre estos 
dos valores. 


4.11 


4.12 


Suponga que 7 posee la funcion de densidad 


0 <y <2, 

en cualquier otro punto. 
a Encuentre el valor de c que haga de/(y) una funcion de densidad de probabilidad. 
b Encuentre F(y). 
c Grafique/(v) y F(y). 
d Use F(y) para hallar P{\ < 7 < 2). 
e Us e/(y) y geometrfa para hallar P(1 < 7S2). 

El tiempo de falla (en cientos de horas) para un transistor es una variable aleatoria 7 con funcion de 
distribution dada por 


f(y) = 


cy, 

o, 


F{y) 


0, y < 0, 

1 — e~ yl , y>0. 
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4.13 


a Demuestre que F(y) tiene las propiedades de una funcion de distribucion. 
b Encuentre el cuantil .30, 4> 30 de Y. 
c Encuentre/(v). 

d Encuentre la probabilidad de que el transistor opere durante al menos 200 horas. 
e Encuentre P(Y > 100|F < 200). 

Un proveedor de queroseno tiene un tanque de 150 galones que se llena al empezar cada semana. Su 
demanda semanal muestra un comportamiento de frecuencia relativo que aumenta de manera continua 
hasta 100 galones y luego se nivela entre 100 y 150 galones. Si Y denota la demanda semanal en cientos 
de galones, la frecuencia relativa de demanda puede ser modelada por 


f(y) 


a Encuentre F(y). 
b Encuentre P(0 < Y < .5). 
c Encuentre P (.5 < E < 1.2). 


' y, 0 < y < 1 , 

1, 1 <y < 1.5, 

. 0 , en cualquier otro punto. 


4.14 Una gasolinera opera dos bombas, cada una de las cuales puede bombear hasta 10,000 galones de gaso- 
lina en un mes. La cantidad total de gasolina bombeada en un mes es una variable aleatoria Y (medida 
en 10,000 galones) con una funcion de densidad de probabilidad dada por 


a Grafique/(v). 


f(y) 


y, 0 < y < 1 , 
2 - y, 1 < y < 2 , 


. 0 , en cualquier otro punto. 


b Encuentre F(y ) y graflquela. 


c Encuentre la probabilidad de que la gasolinera bombee entre 8000 y 12,000 galones en un mes par¬ 
ticular. 

d Dado que la gasolinera bombeo mas de 10,000 galones en un mes particular, encuentre la probabili¬ 
dad de que haya bombeado mas de 15,000 galones durante el mes. 


4.1 5 Como una medicion de inteligencia, a unos ratones se les toma el tiempo que tardan para pasar por un 
laberinto para llegar a una recompensa de alimento. El tiempo (en segundos) necesario para cualquier 
raton es una variable aleatoria Y con una funcion de densidad dada por 


f(y) 



y —b, 

en cualquier otro punto, 


donde b es el tiempo imnimo posible necesario para recorrer el laberinto. 
a Demuestre que/(y) tiene las propiedades de una funcion de densidad. 
b Encuentre F(y). 

c Encuentre P(Y > b + c) para una constante positiva c. 

d Si c y d son constantes positivas tales que d > c, encuentre P(Y > b + d\Y> b + c). 
4.16 Sea Y poseedor de una funcion de densidad 


f(y ) = 


c (2 — y), 0 £ y £ 2 , 

0 , en cualquier otro punto. 
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a Encuentre c. 
b Encuentre F(y). 
c Grafique/(y) y F(y). 

d Use F(y) en el inciso b para hallar /"(l < F < 2). 

e Use geometrfa y la grafica de/(y) para calcular P(1 < F< 2). 

4.17 El tiempo necesario para que estudiantes completen un examen de una hora es una variable aleatoria con 
una funcion de densidad dada por 


cy 1 + y, 0<y<l, 

0. en cualquier otro punto. 



a Encuentre c. 
b Encuentre F(y). 
c Grafique/(y) y F(y). 

d Use F(y) que obtuvo en el inciso b para hallar F(-l), F(0) y F(l). 

e Encuentre la probabilidad de que un estudiante seleccionado al azar termine en menos de media 
hora. 

f Dado que una estudiante particular necesita al menos 15 minutos para completar el examen, encuen¬ 
tre la probabilidad de que requiera al menos 30 minutos para terminar. 

4.18 Tenga Y la funcion de densidad dada por 


.2, -l<y<0, 

/(>-)=' -2 + cy, 0 <y<l, 

. 0, en cualquier otro punto. 


a Encuentre c. 
b Encuentre F(y). 
c Gralique/(y) y F( y). 

d Use F(y) que obtuvo en el inciso b para hallar F(-l), F(0) y F(l). 
e Encuentre F(0 < Y < .5). 
f Encuentre P(Y> .51 Y > . 1). 

4.19 Sea la funcion de distribution de una variable aleatoria Y 


F(y) 



1, j>4. 


a Encuentre la funcion de densidad de Y. 


b Encuentre P(1 < Y < 3). 
c Encuentre F(F> 1.5). 
d Encuentre P(Y > l|F< 3). 
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4.3 Valores esperados para variables 
aleatorias continuas 


El siguiente paso en el estudio de variables aleatorias continuas es hallar sus medias, varianzas 
y desviaciones estandar, con lo cual se adquieren medidas descriptivas numericas asociadas 
con sus distribuciones. Muchas veces es dificil hallar la distribucion de probabilidad para 
una variable aleatoria Y o una funcion de una variable aleatoria, g(Y). Incluso si se conoce la 
funcion de densidad para una variable aleatoria, puede ser dificil evaluar integrales apropia- 
das (veremos que este es el caso cuando una variable aleatoria tiene una distribucion gamma, 
Section 4.6). Cuando encontramos estas situaciones, el comportamiento aproximado de varia¬ 
bles de interes se puede establecer con el uso de sus momentos y la regia empirica o el teorema 
de Tchebysheff (Capitulos 1 y 3). 


D E F I N I C 1 6 N 4.5 El valor esperado de una variable aleatoria continua Y es 

/ OO 

yf{y) dy, 

-oo 

siempre que exista la integral. 3 


Si la definicion del valor esperado para una variable aleatoria discreta y, E(Y) = JT yp(y), 
es significativa, entonces la Definicion 4.4 tambien debe estar de acuerdo con nuestra nocion 
intuitiva de una media. La cantidad/(v)</y corresponde a p(y) para el caso discrete y la integra¬ 
tion evoluciona de una sumatoria y es analoga a ella. En consecuencia, E( Y) en la Definicion 
4.5 concuerda con nuestra nocion de un promedio o media. 

A1 igual que en el caso discrete, en ocasiones estamos interesados en el valor esperado de 
una funcion de una variable aleatoria. Un resultado que nos permite evaluar ese valor esperado 
se da en el siguiente teorema. 


TEOREMA 4.4 


Sea g(Y) una funcion de 7; entonces el valor esperado de g(Y) esta dado por 


E 



g(y)fiy) dy. 


siempre que exista la integral. 


La prueba del Teorema 4.4 es similar a la del Teorema 3.2 y se omite. Los valores espera¬ 
dos de tres importantes funciones de una variable aleatoria Y continua evolucionan como con- 


3. Tecnicamente, se dice que E(Y) existe si 



dy < oo. 


Este sera el caso en todos los valores esperados que estudiemos y no mencionaremos esta condition adicional cada 
vez que definamos un valor esperado. 
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secuencia de teoremas de integration bien conocidos. Como es de esperarse, estos resultados 
llevan a conclusiones analogas a las contenidas en los Teoremas 3.3, 3.4 y 3.5. Por tanto, la 
prueba del Teorema 4.5 se dejara como ejercicio. 


TEOREMA 4.5 Sea c una constante y sean g(Y), #,( Y), gi(Y ),. .. , g k ( Y) funciones de una variable alea- 
toria continua Y. Entonces se cumplen los siguientes resultados: 

1. E(c) = c. 

2. E[cg(Y)]=cE[g(Y)]. 

3. £[gi(r)+g 2 (n + -' ' +gk(Y)] = £[g 1 (y)]+£[g 2 (K)] + -'' +E[g k (Y)]. 


A1 igual que en el caso de variables aleatorias discretas, frecuentemente buscamos el valor 
esperado de la funcion g( Y) = (Y - /jl) 2 . Como antes, el valor esperado de esta funcion es la 
varianza de la variable aleatoria Y. Esto es, como en la Definition 3.5, V(Y) = E( Y - fi) 2 . Es 
un ejercicio sencillo demostrar que el Teorema 4.5 implica que V(Y) = E(Y) 2 - /jl 2 . 


EJEMPLO 4.6 En el Ejemplo 4.4 determinamos que /'(y) = (3/8)y 2 para 0 < y < 2,/(y) = 0 en cualquier 
otro punto, es una funcion de densidad valida. Si la variable aleatoria Y tiene esta funcion de 
densidad, encuentre jj, = E(Y) y a 2 = V(Y). 

Solucion De acuerdo con la Definicion 4.5, 


E(Y) 





= 1.5. 


La varianza de Y se puede hallar una vez determinada E(Y 2 ). En este caso, 


E(Y 2 ) 





= 2.4. 


Por tanto, a 2 = V(Y) = E(Y 2 ) - [£(T)] 2 = 2.4 - (1.5) 2 = 0.15. 
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Ejercicios 

4.20 Si, como en el Ejercicio 4.16, Y tiene funcion de densidad 

jO/^-y), 0<y<2, 

0, en cualquier otro punto, 

encuentre la media y la varianza de Y. 

4.21 Si, como en el Ejercicio 4.17, Y tiene funcion de densidad 

[ (3/2)y 2 +y, 0 < y < 1, 

f(y) = 

l 0, en cualquier otro punto, 

encuentre la media y la varianza de Y. 

4.22 Si, como en el Ejercicio 4.18, Y tiene funcion de densidad 


/O’) 


.2, -l<y<0, 

.2 + (1.2)y, 0<y<l, 


0, 


en cualquier otro punto, 


encuentre la media y la varianza de Y. 

4.23 Demuestre el Teorema 4.5. 

4.24 Si Y es una variable aleatoria continua con funcion de densidad/(y), use el Teorema 4.5 para demostrar 
que a 2 = V(Y) = E(Y 2 ) - [EfT)] 2 - 

4.25 Si, como en el Ejercicio 4.19, Y tiene funcion de distribution 

0 , y < 0, 

-, 0 < v < 2, 

8 

F(y) = 2 

—, 2<y<4, 

16 ^ 

1, y>4, 

encuentre la media y la varianza de Y. 

4.26 Si Y es una variable aleatoria continua con media /u, y varianza cry ay b son constantes, use el Teorema 
4.5 para demostrar lo siguiente: 

a E(aY + b) = aE{Y) +b = ap +b. 
b V(aY +b) = a 2 V(Y) = a 2 a 2 . 


4.27 Para ciertas muestras de minerales, la proportion Y de impurezas por muestra es una variable aleatoria 
con funcion de densidad dada en el Ejercicio 4.21. El valor en dolares de cada muestra es W = 5 - .5T. 
Encuentre la media y la varianza de W. 

4.28 La proportion de tiempo por dia en la que todas las cajas de un supermercado estan ocupadas, es una 
variable aleatoria Y con funcion de densidad 


f(y) 


cy 2 ( l-y) 4 , 0<y<l, 

0, en cualquier otro punto. 


a Encuentre el valor de c que haga de/(v) una funcion de densidad de probabilidad. 
b Encuentre E(Y). 
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4.29 


4.30 


4.31 


4.32 


4.33 


* 4.34 


La temperatura Y a la que se conecta un interrupted controlado por un termostato tiene funcion de den- 
sidad de probabilidad dada por 

1/2, 59 <>><61, 

0, en cualquier otro punto. 

Encuentre E{Y) y V(Y). 


f O') = 


La proportion de tiempo Y en la que un robot industrial esta en operation durante una semana de 40 
horas es una variable aleatoria con funcion de densidad de probabilidad 


/ O') = 


f(y) = 


2y, 0 <y<l, 

0, en cualquier otro punto. 

a Encuentre E{Y) y V(Y). 

b Para el robot motivo de estudio, la utilidad X para una semana esta dada por X = 200y- 60. Encuentre 
E(X) y V(X). 

c Encuentre un intervalo en el que la utilidad sea de al menos 75% durante las semanas que el robot 
este en uso. 

La radiation solar total diaria para un lugar especlfico en Florida durante octubre tiene una funcion de 
densidad de probabilidad dada por 

(3/32)(y — 2)(6 — y), 2 < y < 6, 

. 0, en otro lugar. 

con mediciones en cientos de calorfas. Encuentre la radiation solar diaria esperada para octubre. 

El tiempo semanal de un CPU empleado por una firma de contadores tiene funcion de densidad de pro¬ 
babilidad (medida en horas) dada por 

1 (3/64) v 2 (4 - y), 0 < y < 4, 

I 0, en cualquier otro punto. 

a Encuentre el valor esperado y la varianza de tiempo semanal del CPU. 

b El tiempo del CPU cuesta $200 por hora a la empresa. Encuentre el valor esperado y la varianza del 
costo semanal para el CPU. 

c ^Esperarla usted que el costo semanal esperado exceda de $600 con frecuencia? ^Por que? 

El pH de muestras de agua para un lago especlfico es una variable aleatoria Y con funcion de densidad 
de probabilidad dada por 

' (3/8)(7 - y) 2 , 5<y<7, 

. 0, en cualquier otro punto. 

a Encuentre E(Y) y V(Y). 

b Encuentre un intervalo mas corto que (5, 7) en el que deban estar al menos tres cuartos de las medi¬ 
ciones de pH. 

c ^Esperarla ver con frecuencia una medicion de pH debajo de 5.5? ^Por que? 

Suponga que Y es una variable aleatoria continua con densidad/(y) que es positiva solo si y £ 0. Si F(y) 
es la funcion de distribution, demuestre que 


f(y) = 


f(y) = 


pOO n OO 

E(Y) = / yf(y) dy = I [1 - F(y)] dy. 
Jo Jo 


[Sugerencia: Si y > 0, y — dt , y E(Y) = f Q yf(y) dy = f Q {/ () l dt } f(y) dy. Intercambie el or- 
den de integracion para obtener el resultado deseado.] 4 


4. Los ejercicios precedidos por un asterisco son opcionales. 
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* 4.35 Si Y es una variable aleatoria continua tal que E[{Y- a) 2 ] < oo para toda a, demuestre que E[(Y- a) 2 ] se 
minimiza cuando a = E(Y). [Sugerencia: E[(Y ~ a) 2 ] = £({[F — -£(50] + [£(F) — a]} 2 )-] 

* 4.36 ^El resultado obtenido en el Ejercicio 4.35 tambien es valido para variables aleatorias discretas? ^Por 
que? 

*4.37 Si Fes una variable aleatoria continua con funcion de densidad/(y) que es simetrica alrededor de 0 (es decir, 

f(y)~ f(-y) P ara toda y) y E(Y) existe, demuestre que E{Y) = 0. [Sugerencia: E(Y) = yf(y) dy + 
f^yfiy) dy. Haga el cambio de variable w = -y en la primera integral.] 


4.4 La distribucion de probabilidad uniforme 

Suponga que un autobus llega siempre a una parada particular entre las 8:00 y las 8:10 a.m. 
y que la probabilidad de que llegue en cualquier subintervalo dado es proporcional solo a la 
duration del subintervalo. Esto es, es igual de probable que llegue entre las 8:00 y 8:02 a que 
llegue entre las 8:06 y las 8:08. Denote con Y el tiempo que una persona deba esperar para 
que llegue el autobus si llego a la parada exactamente a las 8:00. Si con cuidado medimos en 
minutos cuanto tiempo despues de las 8:00 llego el autobus en varias mananas, podriamos 
desarrollar un histograma de frecuencia relativa para los datos. 

A partir de la descripcion que acabamos de dar, debe ser evidente que la frecuencia rela¬ 
tiva con la cual observamos un valor de Y entre 0 y 2 serfa aproximadamente la misma que 
la frecuencia relativa con la cual observamos un valor de Y entre 6 y 8. Un modelo razonable 
para la funcion de densidad de Y se muestra en la Figura 4.9. Como las areas bajo las curvas 
representan probabilidades para variables aleatorias continuas y = A 2 (por inspeccion), se 
deduce que P (0 < Y < 2) = P(6 < Y < 8), como se desea. 

La variable aleatoria Y que acabamos de examinar es un ejemplo de una variable aleatoria 
que tiene una distribucion uniforme. La forma general para la funcion de densidad de una 
variable aleatoria con una distribucion uniforme es como sigue. 


DEFINICION 4.6 


Si fl| < 0 7 , se dice que una variable aleatoria Y tiene distribucion de probabilidad uni- 
fonne en el intervalo {9 V Of) si y solo si la funcion de densidad de Y es 


f(y) = 


l 


Oi < y < 0 2 , 


02-01 

0 , en cualquier otro punto. 
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En el problema del autobus podemos tomar 0 t = 0 y 9 2 = 10 porque estamos interesados 
solo en un intervalo particular de diez minutos. La funcion de densidad que se estudia en el 
Ejemplo 4.2 es una distribucion uniforme con 6 1 = 0 y 9 2 = 1. Las graficas de la funcion de 
distribucion y funcion de densidad para la variable aleatoria del Ejemplo 4.2 se dan en las 
Figuras 4.4 y 4.5, respectivamente. 


DEFINICION 4.7 


Las constantes que determinan la forma especffica de una funcion de densidad se deno- 
minan parametros de la funcion de densidad. 


Las cantidades 9 { y 9 2 son parametros de la funcion de densidad uniforme y son valores 
numericos claramente significativos asociados con la funcion de densidad teorica. Tanto la 
amplitud como la probabilidad de que Y caiga en cualquier intervalo determinado dependen 
de los valores de 9 t y f) 2 . 

Algunas variables aleatorias continuas en fisica, administration y ciencias biologicas tie- 
nen distribuciones de probabilidad aproximadamente uniformes. Por ejemplo, suponga que 
el numero de eventos, como las llamadas que entran en un conmutador, que se presentan en el 
intervalo (0, t) tienen una distribucion de Poisson. Si se sabe que exactamente uno de estos 
eventos ha ocurrido en el intervalo (0, t), entonces el tiempo real del suceso esta distribuido de 
manera uniforme en este intervalo. 


EJEMPLO 4.7 La llegada de clientes a una caja en un establecimiento sigue una distribucion de Poisson. 

Se sabe que durante un periodo determinado de 30 minutos, un cliente llega a la caja. Encuentre 
la probabilidad de que el cliente llegue durante los ultimos 5 minutos del periodo de 30 
minutos. 

Solution Como acabamos de citar, el tiempo real de llegada sigue una distribucion uniforme en el in¬ 
tervalo de (0, 30). Si Y denota el tiempo de llegada, entonces 


P (25 < Y < 30) 


f 30 1 30 - 25 

L 30 dy 30 


5 

30 


1 

6 ' 


La probabilidad de que la llegada ocurra en cualquier otro intervalo de 5 minutos tambien es 

1 / 6 . ■ 


Como veremos, la distribucion uniforme es muy importante por razones teoricas. Los es- 
tudios de simulation son tecnicas valiosas para validar modelos en estadfstica. Si deseamos 
un conjunto de observaciones de una variable aleatoria Y con funcion de distribucion F(y), a 
menudo podemos obtener los resultados deseados si transformamos un conjunto de observa¬ 
ciones en una variable aleatoria uniforme. Por esta razon, casi todos los sistemas de computo 
contienen un generador de numeros aleatorios que produce valores observados para una va¬ 
riable aleatoria que tiene una distribucion uniforme continua. 
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TEOREMA 4.6 


Prueba 


Ejercicios 

4.38 Suponga que Y tiene una distribucion uniforme en el intervalo (0, 1). 
a Encuentre F(y). 

b Demuestre que P(a £ Y £ a + b), para a>0,i)£0,yfl + f)£ 1 depende solo del valor de b. 

4.39 Si una paracaidista aterriza en un punto aleatorio en una recta entre los marcadores Ay B, encuentre la 
probabilidad de que ella este mas cerca de A que de B. Encuentre la probabilidad de que su distancia 
hasta A sea mas de tres veces su distancia a B. 

4.40 Suponga que tres paracaidistas operan de manera independiente como se describe en el Ejercicio 4.39. 
^Cual es la probabilidad de que exactamente uno de los tres aterrice en el punto medio entre Ay B? 

4.41 Una variable aleatoria Y tiene una distribucion uniforme en el intervalo (6 j, On). Obtenga la varianza 
de Y. 

4.42 La mediana de la distribucion de una variable aleatoria continua Y es el valor <fi 5 de manera que P(Y £ cj> 5 ) 
= 0.5. ^Cual es la mediana de la distribucion uniforme en el intervalo (0 1 , 0 2 )? 

4.43 Un circulo de radio r tiene area A = nr 2 . Si un circulo aleatorio tiene un radio que esta uniformemente 
distribuido en el intervalo (0, 1), ^cuales son la media y la varianza del area del circulo? 

4.44 El cambio en profundidad de un rio de un dia al siguiente, medida (en pies) en un lugar especifico, es 
una variable aleatoria Y con la siguiente funcion de densidad: 


Si < On V Y es una variable aleatoria uniformemente distribuida en el intervalo 
(6 V 9 n ), entonces 


M = E(Y) = 
Por la Definicion 4.5, 
E(Y ) 


0l + 0 2 2 (02 - Oi) 7 

- y a = V(Y) = -. 

2 y 12 


f 

f 

JOi 


yf(y) dy 


l 


l 


02 01 

2 


dy 


y_ 

0 2 - 0i y 2 

02 01 

2 ' 


6i 


02 - 01 2 

2(02 - 00 


Observe que la media de una variable aleatoria uniforme es simplemente el valor que 
esta a la mitad entre los valores de los dos parametros, (i y 0 2 . La obtencion de la va¬ 
rianza se deja como ejercicio. 


f(y) = 


k, -2 < y < 2 

0 , en cualquier otro punto. 
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a Determine el valor de k. 
b Obtenga la funcion de distribution para Y. 

4.45 A1 estudiar bajas cotizaciones para contratos de embarques, una empresa fabricante de microcompu- 
tadoras encuentra que los contratos interestatales tienen bajas cotizaciones que estan uniformemente 
distribuidas entre 20 y 25, en unidades de miles de dolares. Encuentre la probabilidad de que la baja 
cotizacion en el siguiente contrato interestatal 

a este por debajo de $22,000. 

b sea de mas de $24,000. 

4.46 Consulte el Ejercicio 4.45. Encuentre el valor esperado de bajas cotizaciones en contratos del tipo des- 
crito ahf. 

4.47 La falla de una tarjeta de circuito que utiliza un sistema de computo interrumpe el trabajo hasta que se 
instala una nueva. El tiempo de entrega, F, esta uniformemente distribuido en el intervalo de uno a cinco 
dins. El costo de la falla de una tarjeta y la interruption incluye el costo fijo c 0 de una nueva tarjeta y un 
costo que aumenta proporcionalmente con Y 2 . Si C es el costo en que se incurre, C — c 0 + c 1 Y 2 . 

a Encuentre la probabilidad de que el tiempo de entrega exceda de dos dfas. 

b En terminos de c 0 y c,, encuentre el costo esperado asociado con una sola tarjeta de circuito que 
falle. 

4.48 Si un punto se localiza al azar en un intervalo (a, b) y si Y denota la ubicacion del punto, entonces se 
supone que Y tiene una distribution uniforme en (a, b). Una experta en eficiencia de la planta selecciona 
al azar un lugar, a lo largo de una lrnea de ensamble de 500 pies, desde el cual observa habitos de los 
trabajadores de la lrnea. ^Cual es la probabilidad de que el punto que ella seleccione se encuentre 

a a no mas de 25 pies del final de la lfnea? 

b a no mas de 25 pies del principio de la lrnea? 

c mas cerca del principio de la lrnea que al final de la lrnea? 

4.49 Una llamada telefonica llega a un conmutador al azar en un intervalo de no mas de un minuto. El 
conmutador estuvo totalmente ocupado durante 15 segundos en este periodo de un minuto. ^Cual es la 
probabilidad de que la llamada llegara cuando el conmutador no hubiera estado totalmente ocupado? 

4.50 Empezando a las 12:00 de la noche, un centra de computadoras funciona durante una hora y deja de 
operar dos horas en un ciclo regular. Una persona que desconoce este horario marca al centra en una 
hora al azar entre las 12:00 de la noche y las 5:00 a.m. ^Cual es la probabilidad de que el centra este 
funcionando cuando entre la llamada de la persona? 

4.51 El tiempo de ciclo para camiones que transportan concreto al lugar de construction de una carretera esta 
uniformemente distribuido en el intervalo de 50 a 70 minutos. ^.Cual es la probabilidad de que el tiempo 
de ciclo exceda de 65 minutos si se sabe que el tiempo de ciclo excede de 55 minutos? 

4.52 Consulte el Ejercicio 4.51. Encuentre la media y la varianza de los tiempos de ciclo para los camiones. 

4.53 El numero de tarjetas de circuito defectuosas que salen de una maquina soldadora sigue una distribution 
de Poisson. Durante un dfa especffico de ocho horas, se encontro una tarjeta defectuosa. 

a Encuentre la probabilidad de que haya sido producida durante la primera hora de operation durante 
ese dfa. 

b Encuentre la probabilidad de que haya sido producida durante la ultima hora de operation durante 
ese dfa. 

c Dado que no se produjeron tarjetas defectuosas durante las primeras cuatro horas de operation, en¬ 
cuentre la probabilidad de que la tarjeta defectuosa se fabricara durante la quinta hora. 

4.54 Al usar el metodo de triangulacion para determinar el alcance de una sonda acustica, el equipo de prueba 
debe medir con precision el tiempo que tarda en llegar el frente de onda esferica a un sensor de reception. 
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4.55 


4.56 


4.57 


4.5 


DEFINICION 4.8 


TEOREMA 4.7 


De acuerdo con Perruzzi y Hilliard (1984), los errores de medicion se pueden modelar como si tuvieran 
una distribucion uniforme de -0.05 a +0.05 /xs (microsegundos). 

a /,Cual es la probabilidad de que una medicion de tiempo de llegada sea precisa con tolerancia de 
0.01 /xs? 

b Encuentre la media y varianza de los errores de medicion. 

Consulte el Ejercicio 4.54. Suponga que los errores de medicion estan uniformemente distribuidos entre 
-0.02 a +0.05 /xs. 

a /.Cual es la probabilidad de que una medicion particular de tiempo de llegada sea precisa con toleran¬ 
cia de no mas de 0.01 /xs? 

b Encuentre la media y varianza de los errores de medicion. 

Consulte el Ejemplo 4.7. Encuentre la probabilidad condicional de que un cliente llegue durante los ulti- 
mos 5 minutos del periodo de 30 minutos, si se sabe que ninguno llega durante los primeros 10 minutos 
del periodo. 

De acuerdo con Zimmels (1983), los tamanos de partlculas empleadas en experimentos de sedimen- 
tacion a menudo tienen una distribucion uniforme. En sedimentation que comprenda mezclas de par¬ 
tlculas de varios tamanos, las mas grandes impiden los movimientos de las mas pequenas. Entonces, 
es importante estudiar la media y la varianza de los tamanos de partlculas. Suponga que las partlculas 
esfericas tienen diametros que estan uniformemente distribuidos entre .01 y .05 centimetres. Encuentre 
la media y la varianza de los volumenes de estas partlculas. (Recuerde que el volumen de una esfera es 
(4/3>rr 3 .) 


La distribucion de probabilidad normal 

La distribucion de probabilidad continua que mas se utiliza es la distribucion normal, con la 
conocida forma de campana que estudiamos en relation con la regia empfrica. Los ejemplos 
y ejercicios de esta section ilustran algunas de las numerosas variables aleatorias que tienen 
distribuciones que se calculan en forma muy cercana por medio de una distribucion de proba¬ 
bilidad normal. En el Capftulo 7 presentaremos un argumento que explica, al menos parcial- 
mente, el suceso comun de distribuciones normales de datos en la naturaleza. La funcion de 
densidad normal es como sigue: 


Se dice que una variable Y tiene una distribucion normal de probabilidad si y solo si, 
para cr > 0 y -oo < /x < oo, la funcion de densidad de Y es 

f(y) = —-= e ~CT*)-/( 2 o- 2 ), _ Q0 < y < oo_ 

cryTjr 


Observe que la funcion de densidad normal contiene dos parametros, /x y cr. 


Si Y es una variable aleatoria normalmente distribuida con parametros /x y cr, entonces 

E(Y) = p y V(Y) = a 2 . 





4.5 La distribucion de probabilidad normal 


179 


FIGURA 4.10 
La funcion 
de densidad de 
probabilidad normal 


EJEMPLO 4.8 



La demostracion de este teorema se difiere a la Seccion 4.9, donde obtendremos la funcion 
generadora de momento de una variable aleatoria normalmente distribuida. Los resultados 
contenidos en el Teorema 4.7 implican que el parametro /jl localiza el centra de la distribucion 
y que a mide su dispersion. Una grafica de una funcion de densidad normal se muestra en la 
Figura 4.10. 

Las areas bajo la funcion de densidad normal correspondientes a P(a < K < /;) requieren 
la evaluacion de la integral 


f -^_ e _( )'~A t)2/ (2cr 2 ) dy 

Ja CJ \ 2 tt 

Desafortunadamente, no existe una expresion de forma cerrada para esta integral; en con- 
secuencia, su evaluacion requiere el uso de tecnicas de integracion numerica. Las probabi- 
lidades y cuantiles para variables aleatorias con distribuciones normales se encuentran fa- 
cilmente usando R y 5-Plus. Si Y tiene una distribucion normal con media p, y desviacion 
estandar <x, el comando pnorm (yo, p- , it ) de R (o 5-Plus) genera P(Y < v 0 ) mientras que 
qnorm (p, p. ,<r) da el p-esimo cuantil, el valor de cf) p tal que P(Y < 4> p )= p- Aun cuando 
hay un numero infinito de distribuciones normales (/r puede tomar cualquier valor finito, en 
tanto que cr puede tomar cualquier valor finito positivo), solo necesitamos una tabla —la Tabla 4, 
Apendice 3— para calcular areas bajo densidades normales. Las probabilidades y cuantiles 
asociados con variables aleatorias normalmente distribuidas tambien se pueden hallar usando 
la aplicacion breve (applet) Normal Tail Areas and Quantiles accesibles en www.thomsonedu. 
com/statistics/wackerly. El unico beneficio real obtenido al usar software para obtener pro¬ 
babilidades y cuantiles asociados con variables aleatorias normalmente distribuidas, es que el 
software da respuestas que son correctas hasta un gran numero de lugares decimales. 

La funcion de densidad normal es simetrica alrededor del valor j±, de modo que las areas 
tienen que ser tabuladas en solo un lado de la media. Las areas tabuladas estan a la derecha 
de los puntos z, donde z es la distancia desde la media, medida en desviaciones estandar. Esta 
area esta sombreada en la Figura 4.11. 


Denote con Z una variable aleatoria normal con media 0 y desviacion estandar 1. 

a Encuentre P(Z >2). 
b Encuentre P(— 2 < Z < 2). 
c Encuentre P (0 < Z < 1.73). 
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Solucion a Como /j, = 0 y cr = 1, el valor 2 esta en realidad a z = 2 desviaciones estandar arriba de la 
media. Avance hacia abajo en la primera columna (z) de la Tabla 4, Apendice 3, y lea el area 
opuesta a z = 2.0. Esta area, denotada por el sfmbolo A(z), es A(2.0) = .0228. Entonces, 
P(Z > 2)= .0228. 

b Consulte la Figura 4.12, donde hemos sombreado el area de interes. En el inciso a determi- 
namos que Aj = A( 2.0) = 0.228. Como la funcion de densidad es simetrica alrededor de la 
media /jl = 0, se deduce que A 2 = A l = .0228 y por tanto que 

P(- 2 < Z < 2) = 1 - Aj - A 2 = 1 - 2(.0228) = .9544. 

c Como P(Z > 0) = A(0) = .5, obtenemos que P (0 < Z < 1.73) = .5 - A(1.73), donde 
A(1.73) se obtiene al bajar por la columna z de la Tabla 4, Apendice 3, a la entrada 1.7 y 
luego en sentido horizontal por la parte superior de la tabla a la columna marcada .03 para 
leerA(1.73) = .0418. De estamanera, 

P(0 < Z < 1.73) = .5 - .0418 = .4582. 



EJEMPLO 4.9 Las calificaciones para un examen de admision a una universidad estan normalmente dis- 
tribuidas con media de 75 y desviacion estandar 10. <',Que fraccion de las calificaciones se 
encuentra entre 80 y 90? 

Solucion Recuerde que z es la distancia desde la media de una distribucion normal expresada en unida- 
des de desviacion estandar. Entonces, 


y - u 


z = 


cr 
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FIGURA 4.13 
Area requerida para 
el Ejemplo 4.9 


4.58 



Entrances la fraction deseada de la poblacion esta dada por el area entre 


80 - 75 90 - 75 

zi = ——— = .5 y z 2 = ——— = 1.5. 


10 


10 


Esta area esta sombreada en la Figura 4.13. 

Usted puede ver en la Figura 4.13 que A = A(.5) - A(1.5) = .3085 - .0668 = .2417. ■ 


Siempre podemos transformar una variable aleatoria normal Y en una variable aleatoria 
normal estandar Z si usamos la relation 



cr 


La Tabla 4, Apendice 3 se puede usar para calcular probabilidades, como se muestra aquf. 
Z localiza un punto medido desde la media de una variable aleatoria normal, con la distancia 
expresada en unidades de la desviacion estandar de la variable aleatoria normal original. 
Entonces, el valor medio de Z debe ser 0 y su desviacion estandar debe ser igual a 1. La prueba 
de que la variable aleatoria normal estandar, Z, esta normalmente distribuida con media 0 y 
desviacion estandar 1 se proporciona en el Capftulo 6. 

En la aplicacion breve Normal Probabilities, accesible en www.thomsonedu.com/statis- 
tics/wackerly, se ilustra la correspondencia entre probabilidades normales en las escalas ori- 
ginales y transformadas (z). Para contestar la pregunta planteada en el Ejemplo 4.9, localice el 
intervalo de interes, (80, 90), en el eje horizontal inferior marcado como Y. Las calificaciones 
Z correspondientes se dan en el eje horizontal superior y es evidente que el area sombreada da 
P( 80 < Y < 90) = P(0.5 < Z < 1.5) = 0.2417 (vea la Figura 4.14). Algunos de los 
ejercicios del final de esta section sugieren que el estudiante use esta aplicacion para reforzar 
los calculos de probabilidades asociadas con variables aleatorias normalmente distribuidas. 


Ejercicios 

Use la Tabla 4, Apendice 3 para hallar las siguientes probabilidades para una variable Z aleatoria normal 
estandar: 

a P(0<Z<1.2). 
b P(-.9<Z<0). 
c P(.3 <Z < 1.56). 
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FIGURA 4.14 P(80.0000< Y< 90.0000) = P(0.5()<Z< 1.50) = 0.2417 



Z 


80.00 90.00 
Y 


d P(-.2 < Z < .2). 
e P(-1.56<Z<-.2). 

f Ejercicio Applet Use la aplicacion breve Normal Probabilities para obtenei\P(0 £ Z £ 1.2). ^Por 
que son identicos los valores dados en los dos ejes horizontales? 

4.59 Si Z es una variable aleatoria normal estandar, encuentre el valor z 0 tal que 

a P{Z > zo) — -5. 
b P(Z < zo) = .8643. 
c P(-z 0 <Z<zo) =.90. 
d P(-z 0 <Z<zo) =.99. 

4.60 Una variable aleatoria normalmente distribuida tiene funcion de densidad 

f(y) = —^== e - 6 -M) 2 /( 2 <A) > -oo < y < oo. 
oV2tr 

Usando las propiedades fundamentals asociadas con cualquier funcion de densidad, demuestre que el 
parametro cr debe ser tal que cr > 0. 

4.61 ^Cual es la mediana de una variable aleatoria normalmente distribuida con media p, y desviacion estan¬ 
dar cr? 

4.62 Si Z es una variable aleatoria normal estandar, ^cual es 
a P(Z 2 < 1)? 

b P(Z 2 < 3.84146)? 

4.63 Una compania que manufactura y embotella jugo de manzana usa una maquina que automaticamente 
llena botellas de 16 onzas. Hay alguna variacion, no obstante, en las cantidades de liquido que se ponen 
en las botellas que se llenan. Se ha observado que la cantidad de liquido esta normalmente distribuida en 
forma aproximada con media de 16 onzas y desviacion estandar de 1 onza. 
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a Use la Tabla 4, Apendice 3 para determinar la proportion de botellas que tendran mas de 17 onzas. 
b Ejercicio Applet Use la aplicacion breve Normal Probabilities para obtener la respuesta al inciso a. 

4.64 Se observo que la cantidad semanal de dinero gastado por una companfa durante largo tiempo en mante- 
nimiento y reparaciones, esta normalmente distribuida en forma aproximada con media de $400 y des¬ 
viacion estandar de $20. Si estan presupuestados $450 para la proxima semana, ^cual es la probabilidad 
de que los costos reales rebasen la cantidad presupuestada? 

a Conteste la pregunta usando la Tabla 4, Apendice 3. 

b Ejercicio Applet Use la aplicacion breve Normal Probabilities para obtener la respuesta. 
c /,Por que son diferentes los valores marcados en los dos ejes horizontales? 

4.65 En el Ejercicio 4.64, ^cuanto debe presupuestarse para reparaciones y mantenimiento semanal para 
lograr que la probabilidad de que la cantidad presupuestada en una semana determinada sea excedida 
solo .1? 

4.66 Una operation de maquinado produce cojinetes con diametros que estan normalmente distribuidos con 
media de 3.0005 pulgadas y desviacion estandar de .0010 pulgadas. Las especificaciones requieren que 
los diametros de los cojinetes se encuentren en el intervalo 3.000 ± .0020 pulgadas. Los cojinetes 
que esten fuera de este intervalo son considerados de desecho y deben volver a maquinarse. Con el ajuste 
de la maquina existente, ^que fraccion de la production total se desechara? 

a Conteste la pregunta usando la Tabla 4, Apendice 3. 

b Ejercicio Applet Obtenga la respuesta usando la aplicacion breve Normal Probabilities. 

4.67 En el Ejercicio 4.66, ^cual debe ser el diametro medio para que la fraccion de cojinetes desechados sea 
minima? 

4.68 Los promedios de calificaciones (GPA, por sus siglas en ingles) de una gran poblacion de estudiantes 
universitarios estan normalmente distribuidos en forma aproximada, con media de 2.4 y desviacion 
estandar .8. <)Que fraccion de los estudiantes alcanzaran un GPA de mas de 3.0? 

a Conteste la pregunta usando la Tabla 4, Apendice 3. 

b Ejercicio Applet Use la aplicacion breve Normal Tail Areas and Quantiles para obtener la respuesta. 

4.69 Consulte el Ejercicio 4.68. Si los estudiantes que alcancen un GPA menor que 1.9 seran suspendidos de 
la universidad, ^que porcentaje de los estudiantes sera suspendido? 

4.70 Consulte el Ejercicio 4.68. Suponga que se seleccionan al azar tres estudiantes del alumnado. ^Cual es 
la probabilidad de que los tres alcancen un GPA de mas de 3.0? 

4.71 Se especifica que los cables manufacturados para usarse en un sistema de computadora deben tener re- 
sistencias entre .12 y .14 ohms. Las resistencias medidas reales de los cables producidos por la companfa 
A tienen una distribution de probabilidad normal con media de .13 ohms y desviacion estandar .005 
ohm. 

a ^Cual es la probabilidad de que un cable seleccionado al azar de la production de la companfa A 
satisfaga las especificaciones? 

b Si cuatro de estos cables se usan en el sistema de cada computadora y todos son seleccionados de la 
companfa A, ^cual es la probabilidad de que los cuatro en un sistema seleccionado al azar satisfagan 
las especificaciones? 

4.72 Un metodo para llegar a pronosticos economicos es usar un metodo de consenso. Un pronostico se 
obtiene de todos y cada uno de un gran numero de analistas; el promedio de los pronosticos de estas per¬ 
sonas es el pronostico de consenso. Suponga que los pronosticos de tasa de interes preferential de enero 
de 1996 de todos los analistas economicos estan distribuidos normalmente en forma aproximada con 
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media de 7% y desviacion estandar de 2.6%. Si un solo analista se selecciona al azar entre este grupo, 
^cual es la probabilidad de que el pronostico del analista de la tasa de interes preferencial 

a excedadell%? 
b sea menor que 9%? 

4.73 El ancho de rollos de tela esta normalmente distribuido con media de 950 mm (milfmetros) y desviacion 
estandar de 10 mm. 

a ^Cual es la probabilidad de que un rollo seleccionado al azar tenga un ancho de entre 947 y 958 
mm? 

b ^Cual es el valor apropiado para C de manera que un rollo seleccionado al azar tenga un ancho menor 
que C con probabilidad .8531? 

4.74 Se supone que las calificaciones de un examen estan normalmente distribuidas con media de 78 y va- 
rianza de 36. 

a ^Cual es la probabilidad de que una persona que haga el examen alcance calificaciones mayores de 
72? 

b Suponga que los estudiantes que alcancen el 10% mas alto de esta distribution reciben una califica¬ 
cion de A. ^Cual es la calificacion minima que un estudiante debe recibir para ganar una calificacion 
deA? 

c ^Cual debe ser el punto lfmite para pasar el examen si el examinador desea pasar solo a 28.1% mas 
alto de todas las calificaciones? 

d ^Aproximadamente que proportion de estudiantes tienen calificaciones de 5 o mas puntos arriba de 
la calificacion que corta al 25% mas bajo? 

e Ejercicio Applet Conteste los incisos a-d usando la aplicacion breve Normal Tail Areas and Quantiles. 
f Si se sabe que la calificacion de un estudiante excede de 72, ^cual es la probabilidad de que su cali¬ 
ficacion exceda de 84? 

4.75 Una maquina expendedora de bebidas gaseosas puede ser regulada para descargar un promedio de /x 
onzas por vaso. Si las onzas estan normalmente distribuidas con desviacion estandar de 0.3 onzas, de¬ 
termine los valores para /x de modo que vasos de 8 onzas se sirvan solo 1% del tiempo. 

4.76 La maquina descrita en el Ejercicio 4.75 tiene desviacion estandar a que se puede fijar en ciertos niveles 
al ajustar la maquina con todo cuidado. ^Cual es el maximo valor de a que permitira que la cantidad real 
servida este a no mas de 1 onza de la media con probabilidad de al rnenos .95? 

4.77 Los examenes de admision SAT y ACT (de aptitud y universitario) se aplican a miles de estudiantes cada 
ano. Las secciones de matematicas de cada uno de estos examenes producen calificaciones que estan 
normalmente distribuidas, en forma aproximada. En anos recientes las calificaciones de examenes SAT 
de matematicas han promediado 480 con desviacion estandar de 100. El promedio y desviacion estandar 
para calificaciones ACT de matematicas son 18 y 6, respectivamente. 

a Una escuela de ingenieria establece 550 corno calificacion minima SAT de matematicas para estu¬ 
diantes de nuevo ingreso. (,Que porcentaje de estudiantes obtendra una calificacion por debajo de 550 
en un ano tfpico? 

b (,Que calificacion debe establecer la escuela de ingenieria corno estandar comparable en el examen 
ACT de matematicas? 

4.78 Demuestre que el maximo valor de la densidad normal con parametros /x y cr es 1 /(cn/2rt) y sucede 
cuando y = fjt. 

4.79 Demuestre que la densidad normal con parametros /x y a tiene puntos de inflexion en los valores /x - cr 
y /x + cr. (Recuerde que un punto de inflexion es aquel donde la curva cambia de direction de concava 
hacia arriba a concava hacia abajo o viceversa y ocurre cuando la segunda derivada cambia de signo. 
Este cambio en signo puede presentarse cuando la segunda derivada es igual a cero.) 

4.80 Suponga que Y esta normalmente distribuida con media /x y desviacion estandar a. Despues de observar 
el valor de F, un matematico construye un rectangulo con longitud L = |F| y ancho W = 3|F|. Denote 
con A el area del triangulo resultante. ^Cual es E{A)1 
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4.6 La distribucion de probabilidad gamma 

Algunas variables aleatorias son siempre no negativas y por varias razones dan distribucio- 
nes de datos que esta sesgadas (no simetricas) a la derecha. Esto es, casi toda el area bajo la 
funcion de densidad esta ubicada cerca del origen y la funcion de densidad cae gradualmente 
conforme y aumenta. En la Figura 4.15 se muestra una funcion de densidad de probabilidad 
sesgada. 

Los intervalos de tiempo entre mal funcionamiento de motores de aviones poseen una dis¬ 
tribucion de frecuencia sesgada, al igual que los intervalos de llegada en una fila de espera en 
las cajas de un supermercado (esto es, la fila de espera para llegar a la caja a pagar). Del mismo 
modo, los intervalos de tiempo para completar una revision de mantenimiento para un motor 
de automovil o de avion poseen una distribucion de frecuencia sesgada. La poblacion asociada 
con estas variables aleatorias posee con frecuencia funciones de densidad que son modeladas 
de manera adecuada por una funcion de densidad gamma. 


DEFINICION 4.9 


Se dice que una variable aleatoria Y tiene una distribucion gamma con pardmetros 
a > 0 y /3 > 0 si y solo si la funcion de densidad de Y es 


f(y) 


y a ~ l e ~yip 

w 

o, 


, 0 £ y < oo, 

en cualquier otro punto. 


donde 


E(«) 



y a ~ 1 e ~y dy _ 


La cantidad T(a) se conoce como funcion gamma. La integration directa verificara que 
T(l) = 1. La integracion por partes verifica que r(a) = (a — l)r(o; - 1 ) para cualquier a > 1 
y que T(n) = (n - 1)!, siempre que n sea un entero. 

En la Figura 4.16 se dan graficas de funciones de densidad gamma para a = 1, 2 y 4 y 
13=1. Observe en la Figura 4.16 que la forma de la densidad gamma difiere para los diferen- 
tes valores de a. Por esta razon, a recibe a veces el nombre de pardmetro de forma asociado 
con una distribucion gamma. El parametro (3 generalmente se llama pardmetro de escala 
porque multiplicar una variable aleatoria con distribucion gamma por una constante positiva 
(y por tanto cambiando la escala en la que se hace la medicion) produce una variable aleatoria 


FIGURA 4.15 
Funcion de densidad 
de probabilidad 
sesgada 


f(y) 



y 


o 
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FIGURA 4.16 
Funciones de densi- 
dad gamma, /3 = 1 


TEOREMA 4.8 


que tambien tiene una distribucion gamma con el mismo valor de a (parametro de forma) pero 
con un valor alterado de (3. 

En el caso especial cuando a es un entero, la funcion de distribucion de una variable aleatoria 
con distribucion gamma puede expresarse como una suma de ciertas probabilidades de Poisson. 
Encontrara esta representation en el Ejercicio 4.99. Si a no es un entero y 0 < c < d < oo, 
es imposible dar una expresion de forma cerrada para 



Por esta razon, excepto cuando a = 1 (una distribucion exponencial), es imposible obte- 
ner areas bajo la funcion de densidad gamma por integration directa. Valores tabulados para 
integrates como esta se dan en Tables of the Incomplete Gamma Function (Pearson 1965). 
Por mucho, la forma mas facil de calcular probabilidades asociadas con variables aleatorias 
de distribucion gamma es usar un software de estadfstica. Si Y es una variable aleatoria 
con distribucion gamma y parametros a y /3, el comando pgamma (yo, a, 1//3) de R (o 
5-Plus) genera P(Y < y 0 ), mientras que qgamma (q, a , 1//3) da el p-esimo cuantil, el valor 
de cf> p tal que P(Y < </>,,) = P- Ademas, una de las aplicaciones breves, Gamma Probabilities 
and Quantiles , accesible en www.thomsonedu.com/statistics/wackerly, se puede usar para 
determinar probabilidades y cuantiles asociados con variables aleatorias de distribucion ga¬ 
mma. Otra aplicacion breve en la pagina web de Thomson, Comparison of Gamma Density 
Functions, permitira visualizar y comparar funciones de densidad gamma con diferentes valo¬ 
res para ay/ofi. Estas aplicaciones breves se usaran para contestar algunos de los ejercicios 
del final de esta seccion. 

Como se indica en el siguiente teorema, la media y la varianza de variables aleatorias de 
distribucion gamma son faciles de calcular. 

Si Y tiene una distribucion gamma con parametros a y (3, entonces 


FIGURA 4.16 
Funciones de densi¬ 
dad gamma, /3 = 1 


TEOREMA 4.8 


p = E(Y) = af3 y a 2 = V(Y) = aj3 2 . 








4.6 La distribucion de probabilidad gamma 187 


Demostracion 


DEFINICION 4.10 


/ °° f°° Yv a ~ l e~ y ^\ 


Por definicion, la funcion de densidad gamma es tal que 


r°° v a ~ l P -y/P 

/ AA— 

Jo 


/3 a r(a) 


Por tanto, 


E(Y) = 


l 


pOO 

/ y“- 1 e-?0 rfy =/8“r(ot), 

JO 

00 y a e~ y /P dy 1 


o ^ a r(«) /m«) 


poo 

/ dy 

Jo 


1 


-[/3“ +1 r(a + 1)] = ^ Q ' r(a ' ) 

j8“r(a) r(a) 

Del Ejercicio 4.24, V(y) = /:[ Y 2 ] - [E(Y)\ 2 . Ademas, 


= a/3. 


poo 

E(Y 2 ) = / y 
Jo 


2 (y — e __^\ d = 

P a r(a) ) - / 3 ■ 


i r°° 

°r(a) Jo y 


+I e y P dy 


1 


(3 a Y(a) 


[p a+2 r(a + 2 )] = 


(3 2 { a + l)oT(a) 

i>) 


= a (a + 1 )/3 2 . 


Entonces V( Y) = E[Y 2 ]-[E(Y)] 2 , donde, desde la primera parte de la derivacion, 
E(Y) = a/3. Sustituyendo E[Y 2 \ y E(Y) en la formula para V(Y), obtenemos 


V{Y) = a (a + l)[3 2 - (a/3) 2 = a 2 /3 2 + a/3 2 - a 2 /3 2 = a/3 


Dos casos especiales de variables aleatorias con distribucion gamma ameritan considera¬ 
tion particular. 


Sea v un entero positivo. Se dice que una variable aleatoria Y tiene distribucion 
ji cuadrada con v grados de libertad si y solo si Y es una variable aleatoria con distribu¬ 
cion gamma y parametros a = v/2 y (3 = 2. 


Una variable aleatoria con distribucion ji cuadrada se denomina variable aleatoria 
(X 2 ) ji cuadrada. Estas variables aleatorias se presentan con frecuencia en teorfa estadfstica. 
La motivation que hay detras de llamar al parametro v como grados de libertad de la distri¬ 
bucion x 2 se apoya en una de las principals formas de generar una variable aleatoria con esta 
distribucion y se da en el Teorema 6.4. La media y la varianza de una variable aleatoria x 2 
provienen directamente del Teorema 4.8. 
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TEOREMA 4.9 


Demostracion 


DEFINICION 4.11 


TEOREMA 4.10 


Demostracion 


EJEMPLO 4.10 


Si Y es una variable aleatoria ji cuadrada con v grados de libertad, entonces 
H = E(Y) = v y o- 2 = V(Y) = 2v. 

Aplique el Teorema 4.8 con a = v/2 y f3 = 2. 


En casi todos los textos de estadistica se pueden ver tablas que dan probabilidades asociadas 
con distribuciones x 2 - La Tabla 6, Apendice 3, da puntos porcentuales asociados con distribu¬ 
ciones x 2 para numerosas opciones de v. No se dispone facilmente de tablas de la distribucion 
gamma general, pero demostraremos en el Ejercicio 6.46 que si Y tiene una distribucion gamma 
con a = n/2 para algun entero n, entonces 2 Y/f3 tiene una distribucion x 2 con n grados de 
libertad. De ahf que, por ejemplo, si Y tiene una distribucion gamma con a = 1.5 = 3/2 y 
[3 = 4, entonces 2Y/[3 = 2K/4 = Y/2 tiene una distribucion x 2 con 3 grados de libertad. Entonces, 
P(Y < 3.5) = P(\Y / 2] < 1.75) se puede hallar usando tablas de la distribucion x 2 de las que se 
puede disponer facilmente. 

La funcion de densidad gamma en la que a = 1, se llama funcion de densidad exponen¬ 
tial. 


Se dice que una variable aleatoria Y tiene una distribution exponential con parametro 
(3> 0 si y solo si la funcion de densidad de Y es 


f(y) 


—e , 0 < y < oo, 

j8 

0, en cualquier otro punto. 


La funcion de densidad exponencial a menudo es de ayuda para modelar la vida util de 
componentes electronicos. Suponga que el tiempo que ya ha operado un componente no afec- 
ta su probabilidad de operar durante al menos b unidades de tiempo adicionales. Esto es, la 
probabilidad de que el componente opere durante mas de a + b unidades de tiempo, dado que 
ya ha operado durante al menos a unidades de tiempo, es la misma que la probabilidad de 
que un componente nuevo opere al menos h unidades de tiempo si el componente nuevo se 
pone en servicio en el tiempo 0. Un fusible es un ejemplo de un componente para el cual 
a veces esta suposicion es razonable. Veremos en el siguiente ejemplo que la distribucion 
exponencial proporciona un modelo para la distribucion de la vida util de ese componente. 


Si Y es una variable aleatoria exponencial con parametro /3, entonces 
fi = E(Y) = [3 y o- 2 = V(Y) = [3 2 . 

La demostracion se sigue directamente del Teorema 4.8 con a = 1. 


Suponga que Y tiene una funcion de densidad de probabilidad exponencial. Demuestre que, si 
a > 0 y b > 0, 


P(Y >a+b\Y >a) = P(Y > b). 
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Solution De la definition de probabilidad condicional, tenemos que 

P(Y > a+ b) 


P(Y > a + b\Y > a) = 


P[Y > a) 


porque la intersection de los eventos (Y > a + b) y (Y > a) es el evento ( Y > a + b). Ahora 


r°° 1 

P(Y > a + b) = / - e - y & dy = ~e~ y ^ 

Ja+b P 


= p -(a+b)/p 


i+b 


De manera similar, 


r°° 1 

P(Y > a) = J -e~ y/l3 dy = e~ a/l3 , 


e ~(a+b)/p 

P(Y >a+b\Y >a) = -—- = e~ b/f> = P(Y >b). 

e~ a /P 


Esta propiedad de la distribution exponential en ocasiones recibe el nombre de propiedad sin 
memoria de la distribution. ■ 


Como recordara del Capftulo 3, la distribution geometrica, que es una distribution dis- 
creta, tambien tenia propiedad sin memoria. Una relation interesante entre las distribuciones 
exponencial y geometrica se da en el Ejercicio 4.95. 


Ejercicios 

4.81 a Si a > 0. r(a) esta definida por T(a) = / 0 °° y a ~ 1 e~ y dy, demuestre que T(l) = 1. 

*b Si a > 1, integre por partes para demostrar que TCu) = (a - 1 )r(or - 1). 

4.82 Use los resultados obtenidos en el Ejercicio 4.8 1 para demostrar que si n es un entero positivo, entonces 
T(n) = (n — 1)!. ^Cuales son los valores numericos de r(2), T(4) y T(7)? 

4.83 Ejercicio Applet Use la aplicacion breve Comparison of Gamma Density Functions para obtener los 
resultados dados en la Figura 4.16. 

4.84 Ejercicio Applet Consulte el Ejercicio 4.83. Use la aplicacion breve Comparison of Gamma Density 
Functions para comparar funciones con densidad gamma con (ct =4, /3 — 1), (a = 40, /3 — 1) y 
(a = 80, P = 1). 

a ^Que observa listed acerca de las formas de estas tres funciones de densidad? ^Cuales son menos 
sesgadas y mas simetricas? 

b i,Que diferencias observa acerca de la ubicacion de los centros de estas funciones de densidad? 
c De una explication de lo que observo en el inciso b. 
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4.85 Ejercicio Applet Use la aplicacion breve Comparison of Gamma Density Functions para comparar 
funciones de densidad gamma con (a = 1, j3 = 1), (a = 1, /3 = 2) y (a = 1, /3 = 4). 

a ^Que otro nombre se da a las funciones de densidad que observo? 

b ^Estas densidades tienen la misma forma general? 

c El parametro (3 es un parametro “de escala”. ^Que observa usted acerca de la “dispersion” de estas 
tres funciones de densidad? 

4.86 Ejercicio Applet Cuando examinamos la distribucion \ 2 en esta section, presentamos (con justification 
en el Capftulo 6) el hecho de que si Y tiene distribucion gamma con a = n/2 para algun entero n, enton- 
ces 2Y/j3 tiene una distribucion x 2 - En particular, se dijo que cuando a = 1.5 y /3 = 4, W = Y/2 tiene 
una distribucion \ 2 con ti' es grados de libertad. 

a Use la aplicacion Gamma Probabilities and Quantiles para hallar P(Y < 3.5). 

b Use la aplicacion Gamma Probabilities and Quantiles para hallar P(W < 1.75). [Sugerencia: 
Recuerde que la distribucion x 2 con v grados de libertad es simplemente una distribucion gamma con 
a = v/2 y (3 = 2.\ 

c Compare sus respuestas a los incisos a y b. 

4.87 Ejercicio Applet Hagamos que Y y W tengan las distribuciones dadas en el Ejercicio 4.86. 

a Use la aplicacion Gamma Probabilities and Quantiles para hallar el cuantil .05 de la distribucion de 
Y. 

b Use la aplicacion Gamma Probabilities and Quantiles para hallar el cuantil .05 de la distribucion x 2 
con tres grados de libertad. 

c ^Cual es la relation entre el cuantil .05 de la distribucion gamma (a = 1.5, (3 = 4) y el cuantil .05 de 
la distribucion x 2 con tres grados de libertad? Explique esta relation. 

4.88 La magnitud de temblores registrados en una region de America del Norte puede modelarse como si 
tuviera una distribucion exponential con media 2.4, segun se niide en la escala de Richter. Encuentre la 
probabilidad de que un temblor que ocurra en esta region 

a sea mayor que 3.0 en la escala de Richter. 

b caiga entre 2.0 y 3.0 en la escala de Richter. 

4.89 Si Y tiene una distribucion exponencial y P{Y > 2) = .0821, ^cual es 
a 13 = E(Y)2 

b P{Y < 1.7)? 

4.90 Consulte el Ejercicio 4.88. De los siguientes diez temblores que afecten esta region, ^cual es la probabi¬ 
lidad de que al menos uno de ellos sea mayor que 5.0 en la escala de Richter? 

4.91 El operador de una estacion de bombeo ha observado que la demanda de agua durante las primeras horas 
de la tarde tiene una distribucion aproximadamente exponencial con media de 100 pes (pcs cubicos por 
segundo). 

a Encuentre la probabilidad de que la demanda sea mayor que 200 pcs durante las primeras horas de la 
tarde en un dfa seleccionado al azar. 

b ^Que capacidad de bombeo de agua debe mantener la estacion durante las primeras horas de la tarde 
para que la probabilidad de que la demanda sea mayor que la capacidad en un dfa seleccionado al 
azar sea de solo .01? 

4.92 El tiempo Y necesario para completar una operation clave en la construction de casas tiene una distri¬ 
bucion exponencial con media de 10 horas. La formula C = 100 + 40L + 3 Y 2 relaciona el costo C de 
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completar esta operation con el cuadrado del tiempo para completarla. Encuentre la media y la varianza 
de C. 

4.93 Una evidencia historica indica que los tiempos entre accidentes mortales en vuelos nacionales de horario 
programado en aviones de pasajeros en Estados Unidos tienen una distribucion aproximadamente expo- 
nencial. Suponga que el tiempo medio entre accidentes es de 44 dfas. 

a Si uno de los accidentes ocurrio el 1 de julio de un ano seleccionado al azar en el periodo de estudio, 
^cual es la probabilidad de que ocurra otro accidente ese mismo mes? 

b ^Cual es la varianza de los tiempos entre accidentes? 

4.94 Concentraciones de monoxido de carbono de una hora en muestras de aire de una gran ciudad tienen una 
distribucion aproximadamente exponencial, con media de 3.6 ppm (partes por millon). 

a Encuentre la probabilidad de que la concentracion de monoxido de carbono exceda de 9 ppm durante 
un periodo de una hora seleccionado al azar. 

b Una estrategia de control de transito redujo la media a 2.5 ppm. Ahora encuentre la probabilidad de 
que la concentracion exceda de 9 ppm. 

4.95 Sea Y una variable aleatoria distribuida exponencialmente con media f3. Defina una variable aleatoria X 
en la siguiente forma: X = ksik-l£:Y<k para k = 1,2,... 

a Encuentre P(X = k) para cada k = 1,2,... 

b Demuestre que su respuesta al inciso a se puede escribir como 

P(X = k) = (e- 1 ^)* -1 (1 - e~ l/ P) , k = 1,2,... 

y que X tiene una distribucion geometrica con p = (1 - e -1 " 3 ). 

4.96 Suponga que una variable aleatoria Y tiene una funcion de densidad de probabilidad dada por 

| ky 3 e~ y/2 , y > 0. 

/(>) = 

l 0, en cualquier otro punto. 

a Encuentre el valor de k que haga de/(v) una funcion de densidad. 
b ^ Tiene Y una distribucion x 2 ? Si es asf, ^de cuantos grados de libertad? 
c ^Cuales son la media y la desviacion estandar de Y? 

d Ejercicio Applet ^Cual es la probabilidad de que Y se encuentre a no mas de 2 desviaciones estandar 
de su media? 

4.97 Una planta de manufacture utiliza un producto especffico a granel. La cantidad de producto empleada 
en un dfa puede ser modelada por una distribucion exponencial con (3 = 4 (medida en toneladas). 
Encuentre la probabilidad de que la planta utilice mas de 4 toneladas en un dfa determinado. 

4.98 Considere la planta del Ejercicio 4.97. ^Cuanto producto a granel debe tener en existencia para que la 
probabilidad de que se agote el producto en la planta sea de solo .05? 

4.99 Si A > 0 y a es un entero positivo, la relation entre integrales gamma incompletas y sumas de probabi- 
lidades de Poisson esta dada por 


i r°° a ~ 1 

— / y a ~ 1 e~ y dy = Y 

rwA U 


^ \ x e~ x 


x\ 
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a Si Y tiene una distribution gamma con a = 2 y /3 = 1, encuentre P(Y > 1 ) usando la igualdad anterior 
y la Tabla 3 del Apendice 3. 

b Ejercicio Applet Si Y tiene una distribution gamma con a = 2 y fi = 1, encuentre P(Y > 1) con el 
uso de la aplicacion breve Gamma Probabilities. 


*4.100 


Sea Y una variable aleatoria con distribution gamma donde a es un entero positivo y j3 = 1. El resultado 
dado en el Ejercicio 4.99 implica que si y > 0, 


a—1 


E 


y x e y 
x\ 


P(Y > y). 


Suponga que Xj tiene distribution de Poisson con media y X, tiene distribution de Poisson con media 

A 2 , donde A 2 > Aj. 

a Demuestre que R(X ] = 0) > P(X 2 = 0). 

b Sea k cualquier entero positivo fijo. Demuestre que P(Xj £ k) = P(Y > Aj) y P(X, £ k) = P(Y > A 2 ), 
donde Y es una distribucion gamma con a = k + ly/3 = 1. 

c Sea k cualquier entero fijo positivo. Use el resultado que obtuvo en el inciso b y el hecho de que 
A 2 > A t para demostrar que P{X l £ k) > P(X 2 £ k). 

d Como el resultado del inciso c es valido para cualquier k = 1,2,3,... y el inciso a tambien es valido, 
hemos establecido que P(X l £ k) > P(X 2 £ k ) para toda k — 0, 1,2... Interprete este resultado. 

4.101 Ejercicio Applet Consulte el Ejercicio 4.88. Suponga que la magnitud de los terremotos que afectan la 

region tiene una distribucion gamma con a = .8 y /3 = 2.4. 

a ^Cual es la magnitud media de los terremotos que afectan la region? 

b ^Cual es la probabilidad de que la magnitud de un terremoto que afecte la region exceda de 3.0 en la 
escala Richter? 

c Compare sus respuestas con el Ejercicio 4.88(a). ^Cual probabilidad es mayor? Explique. 

d ^Cual es la probabilidad de que un terremoto que afecte las regiones caiga entre 2.0 y 3.0 en la escala 
Richter? 


4.102 Ejercicio Applet Consulte el Ejercicio 4.97. Suponga que la cantidad de producto usado en un dla tiene 
una distribucion gamma con a = 1.5 y /3 = 3. 

a Encuentre la probabilidad de que la planta use mas de 4 toneladas en un dfa determinado. 

b ^Cuanto del producto a granel debe haber en existencia para que la probabilidad de que la planta 
agote el producto sea de solo .05? 

4.103 Materiales explosivos que se usan en operaciones de minerfa producen crateres casi circulares cuando se 
hacen detonar. Los radios de estos crateres estan distribuidos exponencialmente con media de 10 pies. 
Encuentre la media y la varianza de las areas producidas por estos materiales explosivos. 


4.104 


La vida util (en horas) Y de un componente electronico es una variable aleatoria con funcion de densidad 
dada por 


f(y) 


1 --y/ioo 

100 


y >0, 


0, en cualquier otro punto. 


Tres componentes operan de manera independiente en una pieza de equipo. El equipo falla si fallan al 
menos dos de los componentes. Encuentre la probabilidad de que el equipo opere durante al menos 200 
horas sin fallar. 


4.105 La cantidad total de lluvia de cuatro semanas en verano en una parte del medio oeste de Estados Unidos 
tiene aproximadamente una distribucion gamma con a = 1.6 y ji = 2.0. 
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a Encuentre la media y varianza del total de lluvia de cuatro semanas. 

b Ejercicio Applet ^Cual es la probabilidad de que la cantidad total de lluvia de cuatro semanas sea 
mayor que 4 pulgadas? 

4.1 06 Los tiempos de respuesta en una terminal de computadora en lfnea tienen aproximadamente una distri¬ 
bution gamma con media de cuatro segundos y varianza de ocho segundos 2 . 

a Escriba una funcion de densidad de probabilidad para los tiempos de respuesta. 

b Ejercicio Applet ^Cual es la probabilidad de que el tiempo de respuesta en la terminal sea menor que 
cinco segundos? 

4.1 07 Consulte el Ejercicio 4.106. 

a Use el teorema de Tchebysheff para dar un intervalo que contenga al menos 75% de los tiempos de 
respuesta. 

b Ejercicio Applet ^Cual es la probabilidad real de observar un tiempo de respuesta en el intervalo que 
obtuvo en el inciso a? 


4.108 Los ingresos anuales de jefes de familia en una parte de una ciudad tienen aproximadamente una distri¬ 
bution gamma con a = 20 y f) = 1000. 

a Encuentre la media y la varianza de estos ingresos. 

b ^Esperarfa hallar muchos ingresos de mas de $30,000 en esta section de la ciudad? 

c Ejercicio Applet ^Que proportion de jefes de familia de esta section de la ciudad tienen ingresos de 
mas de $30,000? 

4.109 El tiempo improductivo por semana Y (en horas) de una maquina industrial tiene aproximadamente una 
distribution gamma con a = 3 y (3 = 2. La perdida L (en dolares) para la operation industrial como 
resultado de este tiempo improductivo esta dada por L = 30F + 2 Y 2 . Encuentre la varianza y el valor 
esperados de L. 

4.110 Si Y tiene una funcion de densidad de probabilidad dada por 


f(y) 


4y 2 e~ ly , y > 0, 

0 , en cualquier otro punto. 


obtenga E(Y) y V(Y) por inspection. 

4.111 Suponga que Y tiene una distribution gamma con parametros ay (3. 

a Si a es cualquier valor positivo o negativo tal que a + a > 0, demuestre que 


E{Y a ) 


& T(a +a) 

I>j 


b ^Por que la respuesta en el inciso a requirio que a + a > 0? 
c Demuestre que, con a = 1, el resultado del inciso a da E(Y) = a(i. 

d Use el resultado del inciso a para dar una expresion para E(^[Y). ^Que es necesario suponer acerca de 
a? 

e Utilice el resultado del inciso a para obtener una expresion para E(l/Y), E(/Vv) y E(l/y 2 ). ^,Que es 
necesario suponer sobre a en cada caso? 

4.112 Suponga que Y tiene una distribution x 2 con v grados de libertad. Use los resultados del Ejercicio 4. 111 en 

sus respuestas a lo siguiente. Estos resultados seran utiles cuando estudiemos las distribuciones t y F en el 
Capitulo 7. 
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a Proporcione una expresion para E(Y a ) si v > -2a. 
b ^Por que la respuesta en el inciso a requirio que v > -2a? 

c Use el resultado del inciso a para dar una expresion para E(fY). ^Que es necesario suponer acerca 
de v? 

d Use el resultado del inciso a para dar una expresion para E(l/Y), E( 1 /fY) y E(l/Y 2 ). ^.Que es nece¬ 
sario suponer acerca de v en cada caso? 

4.7 La distribucion de probabilidad beta 

La funcion de densidad beta es una funcion de densidad de dos parametros definida sobre 
el intervalo cerrado 0^)i< 1. Frecuentemente se usa como modelo para proporciones, por 
ejemplo como la proporcion de impurezas en un producto qufmico o la proporcion de tiempo 
que una maquina esta en reparation. 


DEFINICION 4.12 


Se dice que una variable aleatoria Y tiene una distribucion de probabilidad beta con 
parametros a > 0 y [3 > 0 si y solo si la funcion de densidad de Y es 


donde 


Ay) 



0 < y < 1, 

en cualquier otro punto, 





y a ~\l - yf~ l dy 


r (opr Q3) 
r (a+P)' 


Las graficas de funciones de densidad beta toman formas muy diferentes para diversos 
valores de los dos parametros a y /3. Algunos de estos se muestran en la Figura 4.17. Ciertos 
ejercicios del final de esta seccion piden al lector usar la applet Comparison of Beta Density 
Functions accesibles en www.thomsonedu.com/statistics/wackerly para explorar y comparar 
las formas de mas densidades beta. 

Observe que definir y sobre el intervalo 0 < y < 1 no restringe el uso de la distribucion 
beta. Si c < y < d, entonces y* = (y - c) /(d - c) define una nueva variable tal que 0 < y ! < 1 . 
Entonces, la funcion de densidad beta se puede aplicar a una variable aleatoria definida en el 
intervalo c < v s d por traduccion y un cambio de escala. 

La funcion de distribucion acumulativa para la variable aleatoria beta comunmente se de- 
nomina funcion beta incompleta y esta denotada por 

ry - U/3-1 

F(y)= ’ dt = I y (a. fi) 

Jo B{a, P) 


Una tabulacion de I fa. ft) se da en la obra Tables of the Incomplete Beta Function (Pearson, 
1968). Cuando a y (3 son enteros positivos If a. (3) esta relacionada con la funcion de proba- 
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FIGURA 4.17 
Funciones de 
densidad beta 



bilidad binomial. Es posible usar integracion por partes para demostrar que 0 < y < l,yay 
/3 ambos enteros. 


F(y) = 


y to-i 


ry t 

Jo 


(1 -tf- 


B{a,i 3 ) 




donde n = a + f5- 1. Observe que la suma del lado derecho de esta expresion es precisamente 
la suma de probabilidades asociadas con una variable aleatoria binomial n = a + j3- ly p = y. 
La funcion de distribucion acumulativa binomial se presenta en la Tabla 1, Apendice 3, para n 
= 5, 10, 15, 20 y 25 y p= .01, .05, .10, .20, .30, .40, .50, .60, .70, .80, .90, .95 y .99. El modo 
mas eficiente de obtener probabilidades binomiales es usar un software de estadfstica como 
el R o 5-Plus (vea el Capitulo 3). Una forma incluso mas facil para hallar probabilidades y 
cuantiles asociados con variables aleatorias de distribucion beta es usar directamente software 
apropiado. La pagina web de Thomson contiene una aplicacion breve, Beta Probabilities, 
que proporciona probabilidades de “cola superior” [es decir, P(Y> y 0 )] y cuantiles asociados 
con variables aleatorias con distribucion beta. Ademas, si Y es una variable aleatoria con dis¬ 
tribucion beta y parametros a y [3, el comando pbeta (yo, a, 1 /[3) de R (o 5-Plus) genera 
P(Y < v 0 ), mientras que qbeta (p, a , I jfi ) da el p-esimo cuantil, el valor de 4> p de manera 
que PiY < <l) p ) = p. 


TEOREMA 4.11 


Si Y es una variable aleatoria con distribucion beta a > 0 y fi > 0, entonces 


/jl = E(Y) y a 2 = V(Y) 

a + f3 


a |S 

(a +/3) 2 (a + (3 + 1) 
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Demostracion 


EJEMPLO 4.11 


Solucion 


Por definition 
E(Y ) = 


/ OO 

yf(y) dy 

-oo 

1 r y a ~'(l — y )^ -11 


L 


dy 


B(a,/3 ) 

B(a + 1, p) 

B(a, p) 
n<*+P) x r(a + l)r(jg) 
r(a)r(/3) r(a+/3 + l) 


(porque a > 0 implica que a + 1 > 0) 


r (a+P) 


X 


ar(a)r(P) 


r(u)T(P) (a+p)V(a+p) ( a+p ) 

La obtencion de la varianza se deja al lector (vea Ejercicio 4.130). 


Veremos en el siguiente ejemplo que la funcion de densidad beta se puede integrar directa- 
mente cuando ay p son enteros. 


Una distribuidora mayorista de gasolina tiene tanques de almacenamiento a granel que con- 
tienen suministros fijos y se llenan cada lunes. De interes para la mayorista es la proporcion 
de este suministro que se vende durante la semana. Durante varias semanas de observacion, 
la distribuidora encontro que esta proporcion podrfa ser modelada por una distribucion beta 
con a = 4 y /3 = 2. Encuentre la probabilidad de que la mayorista venda al menos 90% de su 
existencia en una semana determinada. 


Si Y denota la proporcion vendida durante la semana, entonces 

-y 3 (l - y), 0 < y < 1, 

en otro lugar, 


f(y) = 


r (4 + 2) -3 , 

r(4)r(2)- 

o, 


/ oo n 1 

f(y) dy = J 9 20 (y 3 - y 4 ) dy 

= 20 | y — ^ - y — J J = 20(.004) = .08. 


No es muy probable que 90% de la existencia se venda en una semana determinada. 
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Ejercicios 

4.113 Ejercicio Applet Use la aplicacion breve Comparison of Beta Density Functions para obtener los resul- 
tados dados en la Figura 4.17. 

4.114 Ejercicio Applet Consulte el Ejercicio 4.113. Use la aplicacion breve Comparison of Beta Density 
Functions para comparar funciones de densidad beta con (a — l, /3 = 1), (a — 1, f) = 2) y {a — 2, 
|6=1). 

a ^Como hemos llamado previamente a la distribucion beta con (a = 1, /J = 1)? 
b ^Cual de estas densidades beta es simetrica? 
c ^Cual de estas densidades beta esta sesgada a la derecha? 
d ^Cual de estas densidades beta esta sesgada a la izquierda? 

*e En el Capltulo 6 veremos que si Y tiene distribucion beta con parametros a y /3, entonces Y* = 
1 - Y tiene una distribucion beta con parametros a* = [3 y f3* = a. ^Esto explica las diferencias en 
las graficas de las densidades beta? 

4.115 Ejercicio Applet Use la aplicacion breve Comparison of Beta Density Functions para comparar funcio¬ 
nes de densidad beta con (a = 2, /3 = 2), (a = 3, (3 = 3) y (a = 9. (3 = 9). 

a ^Cuales son las medias asociadas con las variables aleatorias con cada una de estas distribuciones 
beta? 

b ^Que es semejante acerca de estas densidades? 

c ^Como difieren estas densidades? En particular, ^que observa usted acerca de la “dispersion” de estas 
tres funciones de densidad? 

d Calcule las desviaciones estandar asociadas con las variables aleatorias con cada una de estas den¬ 
sidades beta, i Los valores de estas desviaciones estandar explican lo que se observo en el inciso c? 
Explique. 

e Grafique algunas densidades beta adicionales con a = /3. ^Que se puede conjeturar acerca de la for¬ 
ma de las densidades beta con a = /3? 

4.116 Ejercicio Applet Use la aplicacion breve Comparison of Beta Density Functions para comparar funcio¬ 
nes de densidad beta con (a = 1.5, /3 =7), (a = 2.5, (3 =7) y (a = 3.5, /3 = 7). 

a ^Son simetricas estas densidades? ^Sesgadas a la izquierda? ^Sesgadas a la derecha? 

b ^Que observa usted a medida que el valor de a se acerca a 7? 

c Grafique algunas densidades beta adicionales con a> 1 , f3 > 1, y a < {3. ^Que puede conjeturar 
acerca de la forma de las densidades beta cuando a > \, f3 > \ y a < j33 

4.117 Ejercicio Applet Use la aplicacion breve Comparison of Beta Density Functions para comparar funcio¬ 
nes de densidad beta con (a = 9, /3 = 7), {a = 10, f3 = 7) y (a = 12, /3 = 7). 

a ^Son simetricas estas densidades? ^Sesgadas a la izquierda? ^Sesgadas a la derecha? 

b ^Que observa usted a medida que el valor de a se acerca a 12? 

c Grafique algunas densidades beta adicionales con cc> l,/3> lycc> /3. ^.Que se puede conjeturar 
acerca de la forma de las densidades beta con o>/3ya>ly/3>l? 

4.118 Ejercicio Applet Use la aplicacion breve Comparison of Beta Density Functions para comparar funcio¬ 
nes de densidad beta con (a — .3, f3 = 4), (a = .3, (3 = 7) y (a = .3, f3 = 12). 

a ^Son simetricas estas densidades? ^Sesgadas a la izquierda? ^Sesgadas a la derecha? 

b ^Que observa usted a medida que el valor de {3 se acerca a 12? 
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c ^.Cual de estas distribuciones beta da la mas alta probabilidad de observar un valor mayor que .2? 

d Grafique algunas densidades beta adicionales con a < 1 y [3 > 1. ^Que se puede conjeturar acerca de 
la forma de las densidades beta con a < 1 y j3 > 1? 

4.119 Ejercicio Applet Use la aplicacion breve Comparison of Beta Density Functions para comparer funcio- 
nes de densidad beta con (a = 4, f3 = .3), (a = 7, /3 = .3), y (a = 12, [3 = 3). 

a ^Son simetricas estas densidades? ^Sesgadas a la izquierda? ^Sesgadas a la derecha? 

b ^Que observa usted cuando el valor de a se acerca a 12? 

c ^.Cual de estas distribuciones beta da la mas alta probabilidad de observar un valor menor que .8? 

d Grafique algunas densidades beta adicionales con a > 1 y /3 < 1. ^Que se puede conjeturar acerca de 
la forma de las densidades beta con a>ly/3<l? 

*4.120 En el Capftulo 6 veremos que si Y tiene distribucion beta con parametros ot y [3, entonces Y* — 1 - Y 
tiene una distribucion beta con parametros a* = f3y (3* = a. ^Explica esto las diferencias y similitudes 
en las graficas de las densidades beta en los Ejercicios 4.118 y 4.119? 

4.121 Ejercicio Applet Use la aplicacion breve Comparison of Beta Density Functions para comparer funcio- 
nes de densidad beta con ( a = .5, /3 = .7), (cr = .7, [3 = .7) y (a = .9, /3 = .7). 

a ^.Cual es la forma general de estas densidades? 

b ^Que observa cuando el valor de a aumenta? 

4.122 Ejercicio Applet Las densidades beta con a < 1 y f3 < 1 son diffciles de exhibir debido a problemas de 
escala o resolution. 


a Use la aplicacion breve Beta Probabilities and Quantiles para calcular P(Y > .1) si Y tiene una dis¬ 
tribucion beta con (a = .1, /3 = 2). 

b Use la aplicacion breve Beta Probabilities and Quantiles para calcular P(Y < .1) si Y tiene una dis¬ 
tribucion beta con (a = .1, (3 = 2). 

c Con base en su respuesta el inciso b, cuales valores de Y se les asignan altas probabilidades si Y 
tiene una distribucion beta con (a — .1, /3 = 2)? 

d Use la aplicacion breve Beta Probabilities and Quantiles para calcular P(Y < .1) si Y tiene una dis¬ 
tribucion beta con (a = .1, (3 = .2). 

e Use la aplicacion breve Beta Probabilities and Quantiles para calcular P(Y > .9) si Y tiene una dis¬ 
tribucion beta con (a = .1, (3 = .2). 

f Use la aplicacion breve Beta Probabilities and Quantiles para calcular P(. 1 < Y <.9) si Y tiene una 
distribucion beta con (a = 1 , f3 = .2). 

g Con base en sus respuestas a los incisos d, e y f, ^a cuales valores de Y se les asignan altas probabili¬ 
dades si Y tiene una distribucion beta con {a = .1, (3 = .2)? 

4.123 La humedad relativa Y, cuando se mide en una localidad, tiene una funcion de densidad de probabilidad 

dada por 


[ ky 3 (l — v) 2 , 0 <v<l, 

f(y) = \ 

[ 0, en cualquier otro punto. 


a Encuentre el valor de k que haga de/(y) una funcion de densidad. 

b Ejercicio Applet Use la aplicacion breve Beta Probabilities and Quantiles para hallar un valor de 
humedad que se exceda solo 5% del tiempo. 
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4.124 El porcentaje de impurezas por lote en un producto qrnmico es una variable aleatoria Y con funcion de 
densidad 

1 12y 2 (l — y), 0 <y<l, 

fiy) = \ y y 

1 0, en cualquier otro punto. 

Un lote con mas de 40% de impurezas no se puede vender. 

a Integre la densidad directamente para determinar la probabilidad de que un lote seleccionado al azar 
no se pueda vender por su exceso de impurezas. 

b Ejercicio Applet Use la aplicacion breve Beta Probabilities and Quantiles para hallar la respuesta al 
inciso a. 


4.125 

4.126 


Consulte el Ejercicio 4.124. Encuentre la media y la varianza del porcentaje de impurezas en un lote 
seleccionado al azar del producto qufmico. 

Suponga que una variable aleatoria Y dene una funcion de densidad de probabilidad dada por 

_ 1 6y(l - y), 0 < y < 1, 


f(y) 


I o, 


en cualquier otro punto. 


a Encuentre F(y). 
b Grafique F(y) y f(y). 
c Encuentre P (.5 < Y < .8). 


4.127 Verifique que si Y tiene una distribution beta con ot = p = 1, entonces Y dene una distribution uniforme 

en el intervalo (0, 1). Esto es, la distribution uniforme en el intervalo (0. 1) es un caso especial de una 
distribution beta. 


4.128 El costo Y de reparaciones semanales para una maquina tiene una funcion de densidad de probabilidad 
dada por 

/(y) = 


3(1-y) 2 , 

0 . 


0 <y < 1, 

en cualquier otro punto. 


con mediciones en cientos de dolares. ^Cuanto dinero debe presupuestarse a la semana para costos de 
reparation, de modo que el costo real rebase la canddad presupuestada solo 10% del tiempo? 

4.129 Durante un tumo de ocho horas la proportion de tiempo Y que una maquina troqueladora de laminas meta- 
licas esta sin operar por mantenimiento o reparaciones tiene una distribution beta con a = 1 y /3 = 2. Esto 
es, 

f 2(1 — y), 0<y<l, 

/go = L , . 

I 0, en cualquier otro punto. 

El costo (en cientos de dolares) de este tiempo improductivo, debido a production perdida y costo de 
mantenimiento y reparation, esta dado por C = 10 + 20 Y + 4 Y 2 . Encuentre la media y la varianza 
de C. 


4.130 Demuestre que la varianza de una variable aleatoria con distribution beta y parametros a y p es 

^2 = __ 

{a +/3) 2 (a + p +1) 

4.131 Errores en la medicion del tiempo de llegada de un frente de onda, desde una fuente acustica, en oca- 
siones tienen una distribution beta aproximada. Suponga que estos errores, medidos en microsegundos, 
tienen aproximadamente una distribution beta con a = 1 y p = 2. 

a ),Cual es la probabilidad de que el error de medicion en un ejemplo seleccionado al azar sea menor 
que .5 /rs? 


b Obtenga la media y la desviacion estandar de los errores de medicion. 
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4.132 


4.133 


4.134 


* 4.135 


La mezcla apropiada de polvos finos y gruesos antes de la sinterizacion (aglutinacion) del cobre es 
esencial para lograr uniformidad en el producto acabado. Un modo de verificar la homogeneidad de la 
mezcla es seleccionar muchas muestras pequenas de los polvos mezclados y medir la proporcion del 
peso total aportado por los polvos finos en cada una. Estas mediciones deben ser relativamente estables 
si se ha obtenido una mezcla homogenea. 

a Suponga que la proporcion del peso total aportada por los polvos finos tiene una distribucion beta 

con a = [3 = 3. Encuentre la media y la varianza de la proporcion de peso aportada por los polvos 

finos. 

b Repita el inciso a si a = {3 = 2. 

c Repita el inciso a si a — [3 = 1. 

d ^Cual de los casos —incisos a, b o c— dan la mezcla mas homogenea? 

La proporcion de tiempo por dfa que todas las cajas en un supermercado estan ocupadas es una variable 
aleatoria Y con una funcion de densidad dada por 

,, v fcy 2 (l-y) 4 , 0<y<l, 

f(y) = 

0, en cualquier otro punto. 


a Encuentre el valor de c que haga de/(v) una funcion de densidad de probabilidad. 

b Encuentre E(Y). (Use lo que haya aprendido acerca de la distribucion tipo beta. Compare sus respues- 
tas con las obtenidas en el Ejercicio 4.28.) 

c Calcule la desviacion estandar de Y. 

d Ejercicio Applet Utilice la aplicacion breve Beta Probabilities and Quantiles para hallar 
P(Y > jj, + 2a). 

En el texto de esta section observamos la relation entre la funcion de distribucion de una variable alea¬ 
toria con distribucion beta y las sumas de probabilidades binomiales. Espetificamente, si Y tiene una 
distribucion beta con valores enteros positivos para a y f3 y 0<y< L 


Hy) = 


y t a-l 


r t 

Jo 


(1 -tf- 


B{et, 13) 




donde n = a + (3 - 1 . 

a Si Y tiene una distribucion beta con a = 4 y [3 = 7, use las tablas binomiales apropiadas para hallar 
P(Y< .7) = F(. 7). 

b Si Y tiene una distribucion beta con a = 12 y [3 = 14, use las tablas binomiales apropiadas para hallar 
P(Y < .6) = F(.6 ). 

c Ejercicio Applet Use la aplicacion breve Beta Probabilities and Quantiles para hallar las probabili¬ 
dades en los incisos a y b. 

Suponga que Y { y Y 2 son variables aleatorias binomiales con parametros (n, p() y (n. p 2 ), respectivamen- 

te, donde p l < p 2 . (Observe que el parametro n es el mismo para las dos variables.) 

a Use la formula binomial para deducir que P(Y l = 0) > P{Y 2 = 0). 

b Use la relation entre la funcion de distribucion beta y las sumas de probabilidades binomiales dadas 
en el Ejercicio 4.134 para deducir que, si k es un entero entre 1 y n - 1, 


P(Y 1 £k) = J2[ i ! J(P 1 )'(1-P 1 )" _ ' = 


J' 


t k (l ~t) n 


B{k + 1 ,n — k) 


dt. 
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c Si k es un entero entre 1 y n - 1, el mismo argumento empleado en el inciso b dice que 


P(Y 2 


k ) = ^( . j(p2)‘(! ~ PiT 


f 

J P2 


t k { 1 -t) n - k ~ l 
B(k + 1 , n — k) 


dt. 


Demuestre que si k es cualquier entero entre 1 y n - 1, P(Y l £ k) > P(Y 2 £ k). Interprete este resul- 
tado. 


Algunos comentarios generales 

Recuerde que las funciones de densidad son modelos teoricos para poblaciones de datos reales 
que se presentan en fenomenos aleatorios. - Como sabemos cual modelo usar? /.Cuanto impor- 
ta si usamos la densidad erronea como modelo para la realidad? 

Para contestar primero esta ultima pregunta, es muy poco probable que alguna vez selec- 
cionemos una funcion de densidad que proporcione una representation perfecta de la natu- 
raleza; pero la bondad de ajuste no es el criterio para evaluar lo adecuado de nuestro mode¬ 
lo. La finalidad de un modelo probabilfstico es proveer el mecanismo para hacer inferencias 
acerca de una poblacion con base en information contenida en una muestra. La probabilidad de 
la muestra observada (o una cantidad proporcional a ella) es util para hacer una inferencia 
acerca de la poblacion. Se deduce que una funcion de densidad que proporcione un mal ajuste a la 
distribucion de frecuencia poblacional (pero no necesariamente) da como resultado enunciados 
incorrectos de probabilidad y lleva a inferencias erroneas acerca de la poblacion. Un buen mo¬ 
delo es aquel que produzca buenas inferencias acerca de la poblacion de interes. 

Seleccionar un modelo razonable es a veces cuestion de actuar con base en consideraciones 
teoricas. Con frecuencia, por ejemplo, una situation en la que la variable aleatoria discreta de 
Poisson es apropiada, queda indicada por el comportamiento aleatorio de eventos en el tiem- 
po. Sabiendo esto, podemos demostrar que el tiempo entre cualquier par adyacente de eventos 
sigue una distribucion exponencial. Del mismo modo, si a y b son enteros, a < b, entonces el 
tiempo entre los sucesos de los eventos a-esimo y b-esimo posee una distribucion gamma con 
a = b - a. Mas adelante encontraremos un teorema (llamado teorema central del Umite) que 
compendia algunas condiciones que implican que una distribucion normal serfa una aproxi- 
macion apropiada para la distribucion de datos. 

Una segunda forma de seleccionar un modelo es formar un histograma de frecuencia 
(Capitulo 1) para datos sacados de la poblacion y escoger una funcion de densidad que visual - 
mente parecerfa dar una curva de frecuencia similar. Por ejemplo, si un conjunto de n = 100 
mediciones muestrales diera una distribucion de frecuencia en forma de campana, podriamos 
concluir que la funcion de densidad normal representarfa en forma adecuada la distribucion 
de frecuencia poblacional. 

No toda la seleccion de un modelo es completamente subjetiva. Hay procedimientos esta- 
dfsticos para probar la hipotesis de que una distribucion de frecuencia poblacional es de un 
tipo particular. Tambien podemos calcular una medida de la bondad de ajuste para varias dis- 
tribuciones y seleccionar la mejor. Se han hecho estudios de numerosos metodos inferenciales 
comunes para determinar la magnitud de los errores de inferencia introducidos por modelos 
incorrectos de poblacion. Es alentador saber que muchos metodos estadfsticos de inferencia 
son insensibles a suposiciones acerca de la forma de la distribucion de frecuencia poblacional 
subyacente. 
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Las distribuciones uniforme, normal, gamma y beta ofrecen una variedad de funciones de 
densidad que se ajustan a numerosas distribuciones de frecuencia poblacional. Otra, la distri- 
bucion Weibull, aparece en los ejercicios al final del capftulo. 


4.9 Otros valores esperados 

Los momentos para variables aleatorias continuas tienen definiciones analogas a las dadas 
para el caso discreto. 

DEFINICION 4.13 Si Y es una variable aleatoria continua, entonces el /c-esimo momento alrededor del 
origen esta dado por 

H' k = E{Y k ), k = 1, 2, . . . 

El &-esimo momento alrededor de la media , o el A:-esimo momento central , esta dado 
por 

Abfc = E[(Y - fi) k ], k= 1,2,... 


Observe que para k = I, ji\ = /i y para k = 2, /jl 2 = V( Y) = cr 1 . 


EJEMPLO 4.12 Encuentre (Ji' k para la variable aleatoria uniforme con = 0 y 0 2 = 0. 


Solucion Por definicion, 

/ OO 

y k f(y) dy 

-oo 

Entonces, 

, e 

^ = tl = 2 ’ 



yk+l IS 

9(k + 1) Jo 


e k 

k + V 





6 1 

4 ’ 


y asf sucesivamente. 


DEFINICION 4.14 


Si Y es una variable aleatoria continua, entonces la funcion generadora de momento de 
Y esta dada por 

m(t ) = E(e ,Y ). 

Se dice que existe la funcion generadora de momento si existe una constante b > 0 tal 
que m(t) es finita para |f| < b. 


Este es simplemente el analogo continuo de la Definicion 3.14. Que m(t) genere momentos 
esta establecido en exactamente la misma forma que en la Seccion 3.9. Si m(t) existe, entonces 
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EJEMPLO 4.13 
Solucion 


!(«") - £ <*/(,) - £ (l + ry + ^ + £ + ■ ) /(,) * 


/ oo /*oo ^2 /*oo 

/(>) dy + t yf(y) dy + — I y 2 f(y) dy + ■ ■ 
-oo J—oo ^ • J —00 


r 2 f 3 

= 1 + f/£ + — /£ + —/£ 4 - 

Observe que la funcion generadora de momento, 


/72(f) — 1 + f/r' 4 - —/£ + ' 1 ' > 


toma la misma forma para variables aleatorias discretas y continuas. De esta manera, el 
Teorema 3.12 se cumple para variables aleatorias continuas y 

d k m{t ) 1 . 


Encuentre la funcion generadora de momento para una variable aleatoria de distribucion gamma. 


r 

m{t) = E(e ,Y ) = / 

Jo 

1 f°° 

~ / 3 a r(«) J 0 


jy 


v a ^ a y/fi 
P"T(a) 


dy 


y a ~ l exp 


1 


1 r°° 

— I y a 1 

'(a) Jo ' 


f3°T(a) 


exp 


y \P 


M i-PO. 


dy 

dy. 


[El termino exp(-) es simplemente una forma mas comoda de escribir e ( ) cuando el termino 
del exponente es largo o complejo.] 

Para completar la integration observe que la integral del factor variable de cualquier fun¬ 
cion de densidad debe ser el retiproco del factor constante. Esto es, si f(y) = cg(y), donde c 
es una constante, entonces 

/ oo /*oo noo 

f(y) dy = I cg(y ) dy = 1 y por tanto / g(y) dy = 

-00 J—00 J—00 C 


Aplicando este resultado a la integral en m(f) y observando que si \[3/( 1 - j3t)\ > 0 (o bien, lo 
que es equivalente, si t< 1/jB), 

g(y) = ,v “ _1 X exp{-y/[/3/(l - fit)]} 

es el factor variable de una funcion de densidad gamma con parametros a > 0 y [/3/(l ~ (3t)\ > 0, 
obtenemos 


/72(f) 


1 

(3 a T(a) 



r(«) 


1 

0-/30“ 


para f < —. ■ 
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Los momentos m4 se pueden extraer de la funcion generadora de momento al derivar con 
respecto a t (de acuerdo con el Teorema 3.12) o al expandir la funcion en una serie de poten- 
cias en t. Demostraremos este ultimo metodo. 

EJEMPLO 4.14 

Expanda la funcion generadora de momento del Ejemplo 4.13 en una serie de potencias en t y 
con ello obtenga M/ : . 

Solucion 

Del Ejemplo 4.13, m(t ) = 1/(1 - /3f)“ = (1 - (3t)~ a . Usando la expansion para un termino 
binomial de la forma (x + y)~ c , tenemos 

m(t) = (1 - /3t)~ a = 1 +(-a)(l)-“” 1 (-j3r) 
f (- a )(-a- l)(l)““- 2 (-/3r) 2 + 

2! 

, . t 2 [a(a + l)/3 2 ] t\a{a + l)(a + 2)/3 3 ] 

- 1 + t(aB) + H H + • • •. 

H 2! 3! 

Como /-C es el coeficiente de t k /k\, encontramos, por inspeccion, 

Mi = M 

IL 2 = a(a + l)j3 2 , 

/j-i = a{a + l)(a + 2)/3 3 , 

y, en general, = a{a + l)(a + 2) • • -{a + k — 1 )/3 k . Observe que /jl\ y ix' 2 estan acordes 

con los resultados del Teorema 4.8. Ademas, estos resultados concuerdan con el resultado del 
Ejercicio 4.111(a). ■ 

Ya hemos explicado la importancia de los valores esperados de V*, (T- fju) k , y e' Y , todos los 
cuales dan informacion importante acerca de la distribucion de Y. En ocasiones, no obstante, 
estamos interesados en el valor esperado de una funcion de una variable aleatoria como un ob- 
jetivo en si mismo. (Tambien podemos estar interesados en la distribucion de probabilidad de 
funciones de variables aleatorias, pero dejamos la discusion de este tema hasta el Capftulo 6.) 

EJEMPLO 4.15 

La energfa cinetica k asociada con una masa m que se mueve a una velocidad v esta dada por 
la expresion 

mv 2 
k = -. 

2 

Considere un aparato que dispara un clavo estriado dentro de concreto a una velocidad me¬ 
dia de 2000 pies por segundo, donde la velocidad aleatoria V posee una funcion de densidad 
dada por 

3 -v/500 

f(v) - , V > o. 

J (500) 4 r(4) 


Encuentre la energfa cinetica esperada asociada con un clavo de masa m. 
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Solucion 


TEOREMA 4.12 


EJEMPLO 4.16 

Solucion 


Denote con K la energia cinetica aleatoria asociada con el clavo. Entonces 

. . / mV 2 \ m , 

£W . E ( T ).- E( n 

por el Teorema 4.5, parte 2. La variable aleatoria V tiene una distribution gamma con a = 4 y 
/3 = 500. Por tanto, E(V 2 ) = /jl ' 2 para la variable aleatoria V. Por consulta del Ejemplo 4.14, 
tenemos ii' 2 = ot(a + l)/3 2 = 4(5)(500) 2 = 5,000,000. En consecuencia, 

tn in 

E(K) = y£(P 2 ) = y (5,000,000) = 2,500,000 m. ■ 


Hallar los momentos de una funcion de una variable aleatoria con frecuencia se facilita con el 
uso de su funcion generadora de momento. 


Sea Y una variable aleatoria con funcion de densidad f(y ) y g( Y) una funcion de Y. 
Entonces la funcion generadora de momento para g(Y) es 

/ OO 

e '®(- v )/(y) dy. 

-oo 


Este teorema se concluye directamente de la Definicion 4.14 y el Teorema 4.4. 


Sea g(T) = Y — n, donde Y es una variable aleatoria normalmente distribuida con media jj, 
y varianza er 2 . Encuentre la funcion generadora de momento para g(Y). 


La funcion generadora de momento de g(Y) esta dada por 


/ OO 

-oc 

Para integrar, sea u = y — ji. Entonces du = dy y 

i r 

m (0 = —7== / 

dV2ir J -oo 

l r°° 

= —7= / ex P 

oV277 J -OO 




exp[—(y - f±) 2 /2a 2 ] 
ct\/2tt 


dy. 


e tu e -u 2 K2o- 2 ) 


du 


— ) (n 2 -2 a 2 tu) 


du. 


Complete el cuadrado del exponente de e al multiplicar y dividir entre e ' 2s 2 / 2 Entonces 

exp[—(1/2 ct 2 )(m 2 — 2 cr 2 tu + cr 4 t 2 )] 


/ O 

-c 

/ o 

-c 


= e 


exp[—(n — cr 2 r) 2 2cr 2 ] 
cry/T/rr 


du 


du. 


La funcion dentro de la integral es una funcion de densidad con media er 2 f y varianza <x 2 . (Vea 
la ecuacion para la funcion de densidad normal en la Seccion 4.5.) Por tanto, la integral es 
igual a 1 y , 

m(t)=e^\ 
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Los momentos de U = Y - /jl se pueden obtener de m(t) al derivar m(t) de acuerdo con el 
Teorema 3.12 o al expandir m(t) en una serie. ■ 


El proposito del analisis de momentos anterior es doble. Primero, se pueden usar momen¬ 
tos como medidas descriptivas numericas para explicar los datos que obtenemos en un expe- 
rimento. En segundo termino, se pueden usar en un sentido teorico para demostrar que una 
variable aleatoria posee una distribucion de probabilidad particular. Se puede demostrar que si 
dos variables aleatorias Y y Z poseen funciones generadoras de momento identicas, entonces 
Y y Z poseen distribuciones de probabilidad identicas. Esta ultima aplicacion de los momentos 
se menciono en el analisis de las funciones generadoras de momento para variables aleatorias 
discretas en la Seccion 3.9; tambien se aplica a variables aleatorias continuas. 

Para comodidad del estudiante, las funciones de probabilidad y densidad, medias, varian- 
zas y funciones generadoras de momento para algunas variables aleatorias comunes se dan en 
el Apendice 2 y al final de este libro. 


Ejercicios 

4.136 Suponga que el tiempo de espera para que el primer cliente entre en una tienda de venta al menudeo, 
despues de las 9:00 a.m., es una variable aleatoria Y con una funcion de densidad exponencial dada por 

[ e~ y/e ’ y > 0, 

f(y)= W 

l 0, en cualquier otro punto. 

a Encuentre la funcion generadora de momento para Y. 
b Use la respuesta del inciso a para hallar E(Y) y V(Y). 

4.137 Demuestre que el resultado dado en el Ejercicio 3.158 tambien se cumple para variables aleatorias con¬ 
tinuas. Esto es, demuestre que si Y es una variable aleatoria con funcion generadora de momento m(t) y 
U esta dada por U = aY + b, la funcion generadora de momento de U es e ,b m(at). Si Y tiene media /x 
y varianza cr 2 use la funcion generadora de momento de U para obtener la media y la varianza de U. 

4.138 En el Ejemplo 4.16 se obtuvo la funcion generadora de momento para Y — /jl, donde Y esta distribuida 
normalmente con media /x y varianza a 2 . 

a Use los resultados del Ejemplo 4.16 y el Ejercicio 4.137 para hallar la funcion generadora de momen¬ 
to para Y. 

b Obtenga la derivada de la funcion generadora de momento hallada en el inciso a para demostrar que 
E(Y) = /x y V(Y) = cr 2 . 

4.139 En el Ejercicio 4.138 se demostro que la funcion generadora de momento de una variable aleatoria 
normalmente distribuida, Y, con media /x y varianza a 1 es m(t) = e Mf+U/ 2 )' 2 o- 2 jj se e j resu itado del 
Ejercicio 4.137 para derivar la funcion generadora de momento de X = -3 Y + 4. t,Cual es la distribucion 
de XI t,Por que? 

4.140 Identifique las distribuciones de las variables aleatorias con las siguientes funciones generadoras de 
momento: 


a m(t ) = (1 — At) 2 . 
b m(t) = 1( 1 — 3.2/). 
c m{t) = e~ 5,+6t2 . 
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4.141 Si 6 >, < ft-,, obtenga la funcion generadora de momento de una variable aleatoria que tenga una distribu¬ 
tion uniforme en el intervalo (0,, ft 2 ). 

4.142 Consulte los Ejercicios 4.141 y 4.137. Suponga que Y esta uniformemente distribuida en el intervalo 
(0, 1) y que a > 0 es una constante. 

a Obtenga la funcion generadora de momento para Y. 

b Obtenga la funcion generadora de momento de W = aY. ^Cual es la distribution de IV? ^,Por que? 

c Obtenga la funcion generadora de momento de X = -aY. ^Cual es la distribution de XI ^Por que? 

d Si b es una constante fija, obtenga la funcion generadora de momento de V = aY + b. ^,Cual es la 
distribution de V? ,/Por que? 

4.143 La funcion generadora de momento para la variable aleatoria gamma se obtuvo en el Ejemplo 4.13. 
Encuentre la derivada de esta funcion generadora de momento para hallar la media y la varianza de la 
distribution gamma. 

4.144 Considere una variable aleatoria Y con funcion de densidad dada por 

/( y) = ke~ y 2 ^ 2 , —oo < y <oo. 


4.145 


a Encuentre k. 

b Encuentre la funcion generadora de momento de Y. 
c Encuentre E(Y) y V(Y). 

Una variable aleatoria Y tiene la funcion de densidad 

e y , y < 0, 


f(y) = 


0, en cualquier otro punto. 


a Encuentre E(e 2Y ' 2 ). 

b Encuentre la funcion generadora de momento para Y. 
c Encuentre V(Y). 


4.10 Teorema de Tchebysheff 

Como fue el caso para variables aleatorias discretas, una interpretation de /z y cr para variables 
aleatorias continuas esta dada por la regia empfrica y el teorema de Tchebysheff. Incluso si las 
distribuciones exactas son desconocidas para variables aleatorias de interes, el conocimiento 
de las medias y desviaciones estandar asociadas nos permiten deducir lfmites significativos 
para las probabilidades de eventos que con frecuencia son de interes. 

Expresamos y utilizamos el teorema de Tchebysheff en la Section 3.11. Ahora volvemos a 
expresar este teorema y damos una prueba aplicable a una variable aleatoria continua. 

TEOREMA 4.1 3 Teorema de Tchebysheff Sea Y una variable aleatoria con media finita /j, y varianza cr 2 . 
Entonces, para cualquier k > 0, 

P(\ Y ~ lA <ka) > ! - T 0 p(\y - fi\ > ka) < T. 
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Demostracion 


Daremos la demostracion para una variable aleatoria continua. La prueba para el caso 
discreto se desarrolla de un modo similar. Denote con f(y) la funcion de densidad de Y. 
Entonces, 


V{Y) = a 2 = 

Cjx—kcr 


/ oo 

(y ~v-) 2 f(y) dy 

-oo 

/ fx—Ka pfx+ka 

(y~^) 2 f(y)dy+ iy~n) 2 f(y)dy 

-oo J /x—ka 


/•oo 

+ / ( y-/JL) 2 f(y)dy . 

J n+ka 


La segunda integral es siempre mayor o igual a cero y (y — /J .) 2 2: k 2 a 2 para todos los 
valores de y entre los limites de integration para las integrates primera y tercera; esto es, 
las regiones de integracion estan en las colas de la funcion de densidad e incluyen solo 
valores de y para los cuales (y - j±) 2 > lea 2 . Sustituya con cero la segunda integral y sus- 
tituya k 2 <r 2 por (y - /jl) 2 en las integrates primera y tercera para obtener la desigualdad 

/ fX — k(J nOO 

k 2 cr 2 f(y) dy + I k 2 a 2 f(y) dy. 

-OO J/X+k(r 


Entonces 


o -2 > k 2 cr 2 


/ fX — k(J n "LOO 

f(y) dy + / f{y) 

-oo J ix+kd 


dy 


o bien 


cr 2 > k 2 cr 2 [P(Y — /jl — kcr) + P(Y > /i 4- kcr )] = k 2 cr 2 P(\ Y — /jl\ > ku). 
Dividiendo entre k 2 a 2 , obtenemos 

P(\Y -/a| s ka) < 

o bien, lo que es equivalente, 

P(Y-/i < kcr ) > 1 — —. 


Un valor real del teorema de Tchebysheff es que hace posible que encontremos limites para 
probabilidades que de ordinario tendrian que obtenerse por tediosas manipulaciones matema- 
ticas (integracion o sumatoria). Ademas, con frecuencia podemos obtener medias y varianzas 
de variables aleatorias (vea el Ejemplo 4.15) sin especificar la distribution de la variable. En 
situaciones como esta, el teorema de Tchebysheff todavia proporciona limites significativos 
para probabilidades de interes. 


EJEMPLO 4.17 Supongaque laexperienciahademostrado que el tiempo Y (en minutos) necesario parareali- 
zar una prueba periodica de mantenimiento en una maquina de dictados sigue una distribucion 
gamma con a = 3.1 y j3 = 2. Un trabajador de mantenimiento de nuevo ingreso tarda 22.5 
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minutos en probar la maquina. ,/El tiempo para realizar la prueba esta en desacuerdo con la 
experiencia anterior? 

Solucion La media y la varianza para los tiempos de prueba de mantenimiento (basados en la experien¬ 
cia anterior) son (del Teorema 4.8) 

li = a/3 = (3.1)(2) = 6.2 y cr 2 = a/3 2 = (3.1 )(2 2 ) = 12.4. 

Se deduce que cr = V12.4 = 3.52. Observe que y = 22.5 minutos es mayor que la media de 
fi = 6.2 minutos por 16.3 minutos o k = 16.3/3.52 = 4.63 desviaciones estandar. Entonces, 
del teorema de Tchebysheff, 

P(|L — 6.21 > 16.3) = P{\Y - n\ > 4.63(7) < * = .0466 

Esta probabilidad esta basada en la suposicion de que la distribution de tiempos de man¬ 
tenimiento no ha cambiado con respecto a la experiencia anterior. Entonces, observando que 
P(Y > 22.5) es pequena, debemos concluir que nuestro trabajador de nuevo ingreso ha gene- 
rado por casualidad un largo tiempo de mantenimiento, lo cual sucede con poca probabilidad, 
o bien que el nuevo trabajador es mas lento que los anteriores. Considerando la baja probabi¬ 
lidad de P(Y > 22.5), estamos a favor de este ultimo punto de vista. ■ 


La probabilidad exacta, P(Y > 22.5), para el Ejemplo 4.17 requerirfa evaluar la integral 


P(Y > 22. 



y 2A e ~yl2 

2 31 r(3.i) 


dy. 


Aun cuando podriamos utilizar tablas dadas por Pearson (1965) para evaluar esta integral, no 
podemos hacerlo directamente. Por supuesto que podriamos usarP o .S'-Plus o una de las apli- 
caciones breves para evaluar numericamente esta probabilidad. A menos que usemos software 
de estadistica, integrates similares son dificiles de evaluar para la densidad beta y para muchas 
otras funciones de densidad. El teorema de Tchebysheff a veces proporciona limites rapidos 
para probabilidades a la vez que evita una laboriosa integration, la utilization de software o 
biisquedas de tablas apropiadas. 


Ejercicios 

4.146 Un fabricante de llantas desea calcular un intervalo de rendimiento en millas que excluya no mas de 
10% del rendimiento de las llantas que el vende. Todo lo que sabe es que, para un gran numero de llantas 
probadas, la media de rendimiento fue de 25,000 millas y que la desviacion estandar fue de 4000 millas. 
^Que intervalo sugerirfa usted? 

4.147 Una maquina empleada para llenar cajas de cereal despacha, en promedio, /u onzas por caja. El fabricante 
desea que las Y onzas reales despachadas no rebasen por mas de 1 onza a /jl , al menos 75% del tiempo. 
^Cual es el maximo valor de cr, la desviacion estandar de Y, que se puede tolerar si las metas del fabri¬ 
cante han de satisfacerse? 

4.148 Encuentre P(| Y- /jl\ £ 2a) para el Ejercicio 4.16. Compare con los correspondientes enunciados proba- 
bilisticos dados por el teorema de Tchebysheff y la regia empirica. 
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4.149 Determine P(\Y - /r| < 2a) para la variable aleatoria uniforme. Compare con los correspondientes 
enunciados probabilfsticos dados por el teorema de Tchebysheff y la regia empirica. 

4.150 Determine P(\Y - /x| £ 2cr) para la variable aleatoria exponencial. Compare con los correspondientes 
enunciados probabilfsticos dados por el teorema de Tchebysheff y la regia empirica. 

4.151 Consulte el Ejercicio 4.92. ^Esperarfa que C excediera de 2000 con frecuencia? 

4.152 Consulte el Ejercicio 4.109. Encuentre un intervalo que contenga L durante al menos 89% de las sema- 
nas que la maquina esta en uso. 

4.153 Consulte el Ejercicio 4.129. Encuentre un intervalo para el cual la probabilidad de que C se encuentre 
dentro del mismo sea al menos de .75. 

4.154 Suponga que Y es una variable aleatoria distribuida con x 2 , con v = 7 grados de libertad. 
a ^Cuales son la media y la varianza de T? 

b lEs probable que Y tome un valor de 23 o mas? 

c Ejercicio Applet Use la aplicacion Gamma Probabilities and Quantiles para hallar P{Y > 23). 

4.11 Valores esperados de funciones 
discontinuas y distribuciones 
mixtas de probabilidad (opcional) 

Los problemas en probabilidad y estadfstica en ocasiones incluyen funciones que son parcial- 
mente continuas y parcialmente discretas, en una de dos maneras. Primero, podemos estar 
interesados en las propiedades, por ejemplo el valor esperado de una variable aleatoria g(Y) 
que es una funcion discontinua de una variable aleatoria discreta o continua Y. En segundo 
termino, la variable aleatoria de interes misma puede tener una funcion de distribucion que es 
continua sobre algunos intervalos de manera que algunos puntos aislados tienen probabilida- 
des positivas. 

Ilustramos estas ideas con los siguientes ejemplos. 


EJ EMPLO 4.18 Un vendedor minorista de un producto derivado del petroleo vende una cantidad aleatoria Y 
al dfa. Suponga que Y, medida en miles de galones, tiene la funcion de densidad de probabi¬ 
lidad 


f(y) 


(3/8) y 2 , 0<y<2, 

0, en cualquier otro punto. 


La utilidad del minorista resulta ser de $100 por cada 1000 galones vendidos (100 por galon) 
si Y < 1 y $40 extra por 1000 galones (40 extra por galon) si Y > 1. Encuentre la utilidad 
esperada del minorista para cualquier dfa determinado. 

Solucion Denote con g(Y) la utilidad diaria del minorista. Entonces 



0 < Y < 1, 
1 < Y < 2. 
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Deseamos hallar la utilidad esperada; por el Teorema 4.4, el valor esperado es 

/ OO 

g(y)f(y) dy 

-co 


f 


100y 


300 
(8)(4) ‘ 


-ii 


3 

8 

+ 


f 


dy+ j 140y 


dy 


420 


Jo 


(8)(4) J, 


300 N 420 

-(1) +-(15) = 206.25. 

32 32 


Entonces, el minorista puede esperar una utilidad de $206.25 con la venta diaria de este pro- 
ducto particular. ■ 


Suponga que Y denota la cantidad que paga por poliza en un ano una compafna de seguros 
que proporciona seguro a automoviles. Para muchas polizas, Y = 0 porque las personas ase- 
guradas no estan involucradas en accidentes. Para personas aseguradas que sufren accidentes, 
la cantidad pagada por la compania podrfa ser modelada con una de las funciones de densidad 
que previamente hemos estudiado. Una variable aleatoria Y que tiene alguna de sus probabi- 
lidades en puntos discretos (0 en este ejemplo) y el resto disperso en intervalos, se dice que 
tiene una distribution mezclada. Denote con F(y) una funcion de distribucion de una variable 
aleatoria Y que tiene una distribucion mezclada. Para todos los fines practicos, cualquier fun¬ 
cion F(y) de distribucion mezclada se puede escribir de manera unica como 

F(y) = c l F 1 (y ) + c 2 F 2 (y), 

donde F,(y) es una funcion escalon de distribucion, F 2 (y) es una funcion de distribucion con- 
tinua, Cj es la probabilidad acumulada de todos los puntos discretos y c 2 = 1 - cq es la proba¬ 
bilidad acumulada de todas las porciones continuas. 

El siguiente ejemplo da una ilustracion de una distribucion mezclada. 


EJEMPLO 4.19 Denote con Y la vida util (en cientos de horas) de componentes electronicos. Estos fallan con 
frecuencia inmediatamente despues de conectarlos en un sistema. Se ha observado que la pro¬ 
babilidad de falla inmediata es 1 /4. Si un componente no falla de inmediato, la distribucion 
para su vida util tiene la funcion de densidad exponencial 

f(y) = { e V ’ ^ > °’ 

l 0, en cualquier otro punto. 

Encuentre la funcion de distribucion para Y y evalue P(Y > 10). 

Solucion Hay solo un punto discreto, y = 0, y este punto tiene probabilidad 1 /4. Por tanto, c, = 1/4 y 
c 2 = 3 /4. Se deduce que Y es una mezcla de las distribuciones de dos variables aleatorias, X t 
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FIGURA 4.18 
Funcion de distri¬ 
bution F(y) para el 
Ejemplo 4.19 


DEFINICION 4.15 



y X 2 , donde X ] tiene probabilidad 1 en el punto 0 y X 2 tiene la densidad exponential dada. 
Esto es, 


F\(y) 


0, y < 0, 

1, y> 0, 


y 


F 2 (y) = 


0 , 


y „—a 


/o e 


dx 


y < 0, 
— e~ y , y > 0. 


Ahora 


F(y) = (1 / 4) F\ (y) + (3/4) Fniy), 

y, por tanto, 

P(Y > 10) = 1 - P{Y < 10) = 1 - F(10) 

= 1 -[(1/4) +(3/4)(l -e- 10 )] 

= (3/4)[l-(l- e - 10 )]=(3/4) e - 10 . 


En la Figura 4.18 se da una grafica de F(y). 


Un metodo facil para hallar el valor esperado de variables aleatorias con distribuciones mez- 
cladas se da en la Definicion 4.15. 


Hagamos que Y tenga la funcion de distribucion mezclada 

F(y) = c\F\(y) + c 2 F 2 (y) 

y supongamos que X t es una variable aleatoria discreta con funcion de distribucion 
FjOO y que X 2 es una variable aleatoria continua con funcion de distribucion F 2 (y). 
Denotemos con g(Y) una funcion de Y. Entonces 

E[g{Y)]=c l E[g{X x )]+c 2 E[g{X 2 )l 











Ejercicios 213 


EJEMPLO 4.20 
Solucion 


* 4.155 


* 4.156 


* 4.157 


Encuentre la media y la varianza de la variable aleatoria definida en el Ejemplo 4.19. 
Con todas las definiciones como en el Ejemplo 4.19, se deduce que 

/•OO 

£(Xi)=0 y E(X 2 )= ye~ y dy = 1. 

Jo 


Por tanto, 


Tambien, 


En consecuencia, 
E(Y 2 ) 

Entonces 


/X = E(Y) = (l/4)£(Xi) + (3/4)£(X 2 ) = 3/4. 

/•OO 

E(X\) =0 y E{X\) = / y 2 e~ y dy = 2. 

Jo 

= (1/4 )E(X\) + (3/4)E(X 2 ) = (1/ 4)(0) + (3/4)(2) 
V(Y) = E(Y 2 ) - ix 2 = (3/2) - (3/4) 2 = 15/16. 


3/2. 


Ejercicios 

Una constructora de casas necesita adquirir algunos abastecimientos que tienen un tiempo de espera Y 
para entregarse, con una distribucion uniforme continua en el intervalo de 1 a 4 dfas. Como ella puede 
arreglarselas sin el material durante 2 dfas, el costo de la demora se fija en $100 para cualquier tiempo 
de espera hasta de 2 dfas. Despues de 2 dfas, no obstante, el costo de la demora es $100 mas $20 por dfa 
(prorrateado) por cada dfa individual. Esto es, si el tiempo de espera es 3.5 dfas, el costo de la demora 
es $100 + $20(1.5) = $130. Encuentre el valor esperado del costo de la constructora debido a la espera 
de abastecimientos. 

La duracion Y de llamadas telefonicas de larga distancia (en minutos) vigilada por una estacion es una 
variable aleatoria con propiedades tales que 

P(Y = 3) = .2 y P(Y = 6) = .1. 

De otro modo, Y dene una funcion de densidad continua dada por 

,, , \0/Y)ye-y/\ y > 0, 

f(y) = 

0, en cualquier otro punto. 

Los puntos discretos en 3 y 6 se deben al hecho de que la duracion de la llamada se anuncia a quien 
genera la llamada en intervalos de tres minutos, y quien llama debe pagar tres minutos incluso si habla 
durante un periodo menor. Encuentre la duracion esperada de una llamada de larga distancia selecciona- 
da al azar. 

Se sabe que la vida util Y de un componente empleado en un complejo sistema electronico tiene una 
densidad exponencial con una media de 100 horas. El componente se cambia cuando falla o a una edad 
de 200 horas, lo que ocurra primero. 

a Encuentre la funcion de distribucion para X, la vida util en que el componente esta en uso. 
b Encuentre E(X). 





214 


Capftulo 4 Variables continuas y sus distribuciones de probabilidad 


Considere el aparato que dispara clavos del Ejemplo 4.15. Cuando el aparato funciona, el clavo es dis- 
parado con velocidad, V, con densidad 

v 3 -v/500 

f(v) — -. 

J ’ (500) 4 r(4) 

El aparato no dispara bien 2% del tiempo que se usa, resultando en una velocidad de 0. Encuentre la 
energfa cinetica esperada asociada con un clavo de masa m. Recuerde que la energfa cinetica, k , de una 
masa m que se mueve a velocidad v es k— ( mv 2 ) /2. 

Una variable aleatoria Y tiene funcion de distribucion 

0, si y < 0, 

y 2 +0.1, si0<y < .5, 

W y, si.5<y<l, 

.1, si y > 1. 

a De Fj(y) y F,(y), los componentes discretos y continuos de F(y). 
b Escriba F(y ) como CjFjfy) + c 2 F 2 (v). 
c Encuentre el valor y la varianza esperados de Y. 

4.12 Resumen 

Este capftulo presento modelos probabilfsticos para variables aleatorias continuas. La funcion 
de densidad, que da un modelo para una distribucion de frecuencia poblacional asociada con 
una variable aleatoria continua, de manera subsiguiente dara un mecanismo para inferir ca- 
racterfsticas de la poblacion basada en mediciones contenidas en una muestra tomada de esa 
poblacion. Como consecuencia, la funcion de densidad da un modelo para una distribucion 
real de datos que existe o podrfa ser generada por experimentacion repetida. Distribuciones 
similares para pequenos conjuntos de datos (muestras de poblaciones) se estudiaron en el 
Capftulo 1. 

Cuatro tipos especfficos de funciones de densidad: uniforme, normal, gamma (con la x 2 y 
exponencial como casos especiales) y beta se presentaron y dan una amplia variedad de mo¬ 
delos para distribuciones de frecuencia poblacional. Para comodidad del estudiante, la Tabla 
4.1 contiene un resumen de los comandos R (o 5-Plus) que dan probabilidades y cuantiles 
asociados con estas distribuciones. Muchas otras funciones de densidad podrfan utilizarse 
para ajustarse a situaciones reales, pero las cuatro descritas se adaptan perfectamente en mu- 
chas situaciones. Otras funciones de densidad mas se presentan en los ejercicios al final del 
capftulo. 

Lo adecuado de una funcion de densidad para modelar la distribucion de frecuencia para una 
variable aleatoria depende de la tecnica para hacer inferencias que se emplee. Si un modesto desa- 


Tabla 4.1 Procedimientos R (y 5-Plus) que dan probabilidades y percentiles para algunas 
distribuciones continuas comunes 


Distribucion 

P(Y < y 0 ) 

p-esimo cuantil: 

4> p manera que P{Y < (f > p ) = p 

Normal 

pnorm(y 0 ,/x,o-) 

qnorm( p, p,, a) 

Exponencial 

pexp (y 0 ,1 //3 ) 

qexp(p, 1//3) 

Gamma 

pgamma (y 0 , a, 1 //3) 

qgamma (p, a, 1 //3) 

Beta 

pbeta (y 0 ,a ,/3) 

qbeta(p ,a,/3) 


* 4.158 


* 4.159 
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cuerdo entre el modelo y la distribucion de frecuencia de poblacion real no afecta la bondad del 
procedimiento inferencial, el modelo es adecuado. 

La ultima parte del capltulo se ocupo de valores esperados, en particular momentos y 
funciones generadoras de momento. Es importante concentrar la atencion en la razon para 
presentar estas cantidades y evitar excesiva concentration en los aspectos matematicos del 
material. Los momentos, particularmente la media y la varianza, son medidas descriptivas 
numericas para variables aleatorias. En especial, mas adelante veremos que a veces es dificil 
hallar la distribucion de probabilidad para una variable aleatoria Y o una funcion g(Y), y ya 
hemos observado que la integration en intervalos para muchas funciones de densidad (la nor¬ 
mal y gamma, por ejemplo) es muy dificil. Cuando esto ocurre, podemos describir de un modo 
aproximado el comportamiento de la variable aleatoria con el uso de sus momentos, junto con 
el teorema de Tchebysheff y la regia emplrica (Capftulo 1). 
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Ejercicios complementarios 

4.160 Sea la funcion de densidad de una variable aleatoria Y dada por 

f ---, -1 < y < 1, 

f(y) = 7r(! + y 2 ) 

l 0, en cualquier otro punto. 

a Encuentre la funcion de distribucion. 
b Encuentre E(Y). 
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4.161 


4.162 


4.163 

4.164 


4.165 


4.166 


4.167 

4.168 


4.169 


* 4.170 


El tiempo necesario para completar un examen de aptitud en universidades se encuentra normalmente 
distribuido con media de 70 minutos y desviacion estandar de 12 minutos. ^Cuanto debe durar el exa¬ 
men si deseamos que 90% de los estudiantes tenga suficiente tiempo para completar el examen? 

Una fabrica utiliza 3000 focos cuya vida util esta normalmente distribuida con media de 500 horas y 
desviacion estandar de 50. Para reducir al mrnimo el numero de focos que se queman durante horas de 
operation, todos son cambiados despues de un periodo determinado. ^Con que frecuencia deben cam- 
biarse los focos si deseamos que no mas de 1% de los focos se quemen entre periodos de cambio? 

Consulte el Ejercicio 4.66. Suponga que cinco cojinetes se sacan al azar de la production. ^.Cual es la 
probabilidad de que al rnenos uno este defectuoso? 

La vida util de las barrenas de perforation de pozos petroleros depende de los tipos de roca y suelo que 
encuentren al perforar, pero se estima que la duration media es de 75 horas. Una compafua de explora¬ 
tion compra barrenas cuya vida util esta normalmente distribuida, en forma aproximada, con media de 
75 horas y desviacion estandar de 12 horas. i,Que proportion de las barrenas de la compafua 

a fallaran antes de 60 horas de uso?, 

b duraran al menos 60 horas?, 

c tendran que ser cambiadas despues de mas de 90 horas de uso? 

Sea que Y tenga funcion de densidad 

1 cye~ 2y , 0 £ y £ oo, 

/(.v) = | 

l 0, en cualquier otro punto. 

a Encuentre el valor de c que haga de/(v) una funcion de densidad. 
b Obtenga la media y la varianza para Y. 
c Obtenga la funcion generadora de momento para Y. 

Use el hecho de que 


e z 


= 1 + z + 


2 ! 




+ ... 


para expandir la funcion generadora de momento del Ejemplo 4.16 en una serie para hallar /Xj, /x 2 , /x 3 y 
/x 4 para la variable aleatoria normal. 

Encuentre una expresion para j±' k = E(Y k ), donde la variable aleatoria Y tiene una distribution beta. 

El numero de llegadas N a una caja de un supermercado en el intervalo de 0 a t sigue una distribution de 
Poisson con media At. Denote con T el tiempo hasta la primera llegada. Encuentre la funcion de densi¬ 
dad para T. [Note: P(T > t 0 ) = P(N = 0 en t = t 0 ).j 

Se puede usar un argumento semejante al del Ejercicio 4.168 para demostrar que si los eventos ocurren 
en el tiempo de acuerdo con una distribution de Poisson con media At, entonces los tiempos de llegada 
entre eventos tienen una distribution exponential con media 1 /A. Si entran llamadas a un centra policial 
de emergencia a razon de diez por hora, ^cual es la probabilidad de que transcurran mas de 15 minutos 
entre las dos llamadas siguientes? 

Consulte el Ejercicio 4.168. 

a Si U es el tiempo hasta la segunda llegada, demuestre que U tiene una funcion de densidad gamma 
con a = 2 y (3 = 1/A. 

b Demuestre que el tiempo hasta la A-esima llegada tiene una densidad gamma con a = k y 
13= 1/A. 
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4.171 

4.172 

4.173 

4.174 

4.175 

4.176 

4.177 


4.178 


*4.179 


Suponga que llegan clientes a una caja a razon de dos por minuto. 

a ^Cuales son la media y la varianza de los tiempos de espera entre llegadas sucesivas de clientes? 

b Si una empleada tarda tres minutos en atender al primer cliente que llega a una caja, ^cual es la 
probabilidad de que al menos un cliente mas este esperando cuando se termine de servir al primer 
cliente? 

Las llamadas para conexiones de entrada a un centro de computation llegan a un ritmo promedio de cua- 
tro por minuto. Las llamadas siguen una distribucion de Poisson. Si llega una llamada al principio de un 
intervalo de un minuto, ^cual es la probabilidad de que una segunda llamada no llegue en los siguientes 
20 segundos? 

Suponga que plantas de una especie particular se dispersan en una superficie de modo que el numero 
de ellas en un area determinada sigue una distribucion de Poisson con densidad media de A plantas por 
unidad de area. Si una planta se selecciona al azar en esta area, encuentre la funcion de densidad de pro¬ 
babilidad de la distancia a la planta vecina mas cercana. [Sugerencia: Si R denota la distancia a la vecina 
mas proxima, entonces P(R> r) es igual a la probabilidad de no ver plantas en un tirculo de radio r.] 

El tiempo (en horas) que un gerente tarda en entrevistar a un solicitante de trabajo dene una distribucion 
exponencial con f5 = 1/2. Los solicitantes son citados a intervalos de un cuarto de hora, empezando a 
las 8:00 a.m. y llegan exactamente a tiempo. Cuando el candidato citado a las 8:15 a.m. llega a la oficina 
del gerente, ^,cual es la probabilidad de que tenga que esperar antes de ser entrevistado? 

El valor de la mediana y de una variable aleatoria continua es aquel para el que F(y) = .5. Encuentre el 
valor de la mediana de la variable aleatoria del Ejercicio 4.11. 

Si Y tiene una distribucion exponencial con media /3, encuentre (como funcion de /3) la mediana de Y. 

Ejercicio Applet Use la aplicacion Gamma Probabilities and Quantiles para hallar las medianas de 
variables aleatorias con distribucion gamma y parametros 

a a = 1, j8 = 3. Compare su respuesta con la del Ejercicio 4.176. 

b a = 2, (3 = 2. ^La mediana es mayor o menor que E(Y)7 

c a = 5, /3 = 10. ^,La mediana es mayor o menor que E{Y)7 

d En todos estos casos, la mediana excede a la media. ^Como se refleja eso en las formas de las densi- 
dades correspondientes? 

Grafique la funcion de densidad de probabilidad beta para a = 3 y [3 = 2. 

a Si Y tiene esta funcion de densidad beta, encuentre P(.\ .2) usando probabilidades binomiales 

para evaluar F(y). (Vea la Section 4.7.) 

b Ejercicio Applet Si Y tiene esta funcion de densidad beta, encuentre P(. 1 £ f£ .2), usando la apli¬ 
cacion Beta Probabilities and Quantiles. 

c Ejercicio Applet Si Y tiene esta funcion de densidad beta, use la aplicacion Beta Probabilities and 
Quantiles para hallar los cuantiles .05 y .95 para Y. 

d ^Cual es la probabilidad de que Y caiga entre los dos cuantiles encontrados en el inciso c? 

Una comerciante al menudeo tiene una demanda diaria Y de cierto alimento que se vende por libra, 
donde Y (medido en cientos de libras) tiene una funcion de densidad de probabilidad dada por 


Hv) = 


3y 2 , 0<y<l, 

0, en cualquier otro punto. 
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4.180 


4.181 


*4.182 


4.183 


4.184 


*4.185 


(Ella no puede tener en existencia mas de 100 libras.) La comerciante desea adquirir 100L libras de ali- 
mento, que compra en 60 por libra y lo vende en 100 por libra. ^Que valor de k minimizara su utilidad 
diaria esperada? 

Suponga que Y tiene una distribution gamma con a = 3 y (3 = 1 . 

a Use probabilidades de Poisson para evaluar P(Y :£ 4). (Vea el Ejercicio 4.99.) 

b Ejercicio Applet Use la aplicacion Gamma Probabilities and Quantiles para hallar P(Y £ 4). 

Suponga que Y es una variable aleatoria normalmente distribuida con media /x y varianza cr 2 . Use los 
resultados del Ejemplo 4.16 para hallar la funcion generadora de momento, media y varianza de 


),Cual es la distribucion de Z? ),Por que? 


Z = 


y-p 


a 


Se dice que una variable aleatoria Y tiene una distribucion log-normal si X = ln(L) tiene una distribucion 
normal. (El slmbolo In denota logaritmo natural.) En ese caso Y debe ser no negativa. La forma de la 
funcion de densidad de probabilidad log-normal es semejante a la de la distribucion gamma, con una 
larga cola a la derecha. La ecuacion de la funcion de densidad log-normal esta dada por 


f(y) 


1 „-(ln(y)- M ) 2 ( 2o- 2 ) 

cryV^TT 

0 , 


Como ln(v) es una funcion monotonica de y. 


y>0, 

en cualquier otro punto. 


P(Y < y) = P[ln(L) < ln(y)] = P[X < ln(y)]. 


donde X tiene una distribucion normal con media /x y varianza cr 2 . De esta forma, las probabilidades 
para variables aleatorias con una distribucion log-normal se pueden hallar al transformarlas en proba¬ 
bilidades que puedan calcularse usando la distribucion normal ordinaria. Si Y tiene una distribucion 
log-normal con /x = 4 y cr 2 = 1, encuentre 

a P(Y < 4). 

b P(Y > 8 ). 

Si Y tiene una distribucion log-normal con parametros /x y cr 1 se puede demostrar que 
E(Y) = e i,L+a2)/2 y V(Y) = - 1). 

Los granos que componen metales policristalinos tienden a tener pesos que siguen una distribucion 
log-normal. Para un tipo de aluminio, los pesos en gramos tienen una distribucion log-normal con 
/x = 3 y cr = 4 (en unidades de 1CL 2 g). 

a Encuentre la media y la varianza de los pesos en los granos. 

b Encuentre un intervalo en el que al menos 75% de los pesos en granos deben estar. [Sugerencia: Use 
el teorema de Tchebysheff.] 

c Encuentre la probabilidad de que un grano seleccionado al azar pese menos que el peso medio del 
grano. 

Denote con Y una variable aleatoria con funcion de densidad de probabilidad dada por 

f(y)=(l/2)e~ M , -oo<y<oo. 


Encuentre la funcion generadora de momento de Y y usela para hallar E{Y). 

Sean/j(y) y/ 2 Cy) funciones de densidad y sea a una constante tal que 0 £ a £ 1. Considere la funcion 

f(y) = af i(y) + (1 - a)f 2 (y). 
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a Demuestre que f(y) es una funcion de densidad que se conoce con frecuencia como mezcla de dos 
funciones de densidad. 

b Suponga que Y l es una variable aleatoria con funcion de densidad /j(y) y que E(Y\) = /x, y 
Var(lj) = o-j 2 ; y del mismo modo suponga que Y 2 es una variable aleatoria con funcion de densidad 
fi 09 y que E(Y 2 ) = /x 2 y Var(K 2 ) = cr 2 . Suponga que Y es una variable aleatoria cuya densidad es una 
mezcla de las densidades correspondientes a Y t y Y 2 . Demuestre que 

i E(Y) = a/x i + (1 — a)/x 2 . 

ii Var(y) = acr 2 + (1 — a)a 2 + a(l — a)[/x i — /x 2 ] 2 . 

[Sugerencia: E{Yf) — /x 2 + o; 2 , i = 1, 2.] 

4.186 Se dice que la variable aleatoria Y , con una funcion de densidad dada por 

my m ~i _ m 

f(y) = —-- e y “, 0 £ y < oo, a, m > 0 

a 


tiene una distribucion Weibull. La funcion de densidad Weibull da un buen rnodelo para la distribucion 
de vida util para rnuchos aparatos mecanicos y plantas biologicas y animales. Encuentre la media y la 
varianza para una variable aleatoria con distribucion Weibull con m = 2. 

4.1 87 Consulte el Ejercicio 4.186. Los resistores que se usan en la construccion de un sistema de gufa en avio- 
nes tienen vidas utiles que siguen una distribucion Weibull con m = 2 y a = 10 (con medidas en miles 
de horas). 

a Encuentre la probabilidad de que la vida util de un resistor de este tipo seleccionado al azar exceda 
de 5000 horas. 

b Si tres resistores de este tipo operan de manera independiente encuentre la probabilidad de que exac- 
tamente uno de los tres se queme antes de 5000 horas de uso. 

4.1 88 Consulte el Ejercicio 4.186. 

a ^Cual es el nombre comun de la distribucion de una variable aleatoria que tiene una distribucion 
Weibull con m = 1 ? 

b Obtenga, en terminos de los parametros a y m, la media y la varianza de una variable aleatoria con 
distribucion Weibull. 


4.1 89 Si n > 2 es un entero, la distribucion con densidad dada por 

r 1 


_ ,,2-,(n-4)/2 _ 


f(y) = B( 1/2, [n — 2]/2) 

lo. 


(i ~y ) 


1 <y < 1, 


en cualquier otro punto. 

Se llama la distribucion r. Determine la media y la varianza de una variable aleatoria con la distribu¬ 
cion r. 


4.190 Una funcion en ocasiones asociada con variables aleatorias continuas no negativas es la funcion de por- 
centaje de falla (o porcentaje de riesgo), que esta definida por 


r(t) 


fit) 

1 - F(t) 


para una funcion de densidad fit) con funcion de distribucion correspondiente F(t). Si consideramos la 
variable aleatoria en cuestion como la duracion de un componente, r{t) es proporcional a la probabilidad 
de falla en un pequeno intervalo despues de t, dado que el componente ha seguido en servicio despues de t. 
Demuestre que, 

a para una funcion de densidad exponencial, r(t) es constante, 

b para una funcion de densidad Weibull con m> 1, r(t) es una funcion creciente de t. (Vea el Ejercicio 
4.186.) 
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*4.191 


Suponga que F es una variable aleatoria continua con una funcion de distribucion dada por F(y) y fun- 
cion de densidad de probabilidad/(y). Con frecuencia estamos interesados en conocer las probabilidades 
condicionales de la forma P(Y £ y|F a c) para una constante c. 


a Demuestre que, para y a c, 


P(Y <y|F a c ) 


F (y) ~ F(c) 
1 - F(c) 


b Demuestre que la funcion en el inciso a tiene todas las propiedades de una funcion de distribucion. 

c Si la duracion Y para una baterfa tiene una distribucion Weibull con m = 2 y a = 3 (con mediciones 
en afios), encuentre la probabilidad de que la baterfa dure menos de cuatro anos, en vista que ahora 
ya tiene dos anos. 

*4.1 92 Las velocidades de partfculas de gas pueden ser modeladas por la distribucion de Maxwell, cuya funcion 
de densidad de probabilidad esta dada por 

/(v) = 47 r(-^—) 3/2 v 2 e- vH ’ n / l2KT]) , v > 0, 

\2ttKT) 


*4.193 


donde m es la masa de la partfcula, K es la constante de Boltzmann y T es la temperatura absoluta. 
a Encuentre la velocidad media de estas partfculas. 

b La energfa cinetica de una partfcula esta dada por (1 /2)mV 2 . Encuentre la energfa cinetica media 
para una partfcula. 


En vista de que 


P(Y <y|F ac) 


F (y) - F(c) 
1 - F(c) 


tiene las propiedades de una funcion de distribucion, su derivada tendra las propiedades de una funcion 
de densidad de probabilidad. Esta derivada esta dada por 


f(y) 

1 - F(c) ’ 


y a c. 


Podemos entonces hallar el valor esperado de F, dado que F es mayor que c, con el uso de 

1 r°° 

EVlrzo-—-[ ,/(,)*. 


Si F, la duracion de un componente electronico, tiene una distribucion exponencial con media de 100 
horas, encuentre el valor esperado de F, dado que este componente ya ha estado en uso durante 50 flo¬ 
ras. 


*4.194 Podemos demostrar que la funcion de densidad normal se integra hasta la unidad al demostrar que, si 
/r, > 0, 


i r e -o/2 w dy = A 

V2tt J-oo V' 


V«' 


*4.195 


Esto, a su vez, se puede demostrar al considerar el producto de dos de estas integrales: 

' ( f e ~ (1/2)uy2 dy) ( [ e ~ {l/2)uxl Jx) = — f f e ~ (l/2)u(xl+y2) dx dy. 

27T Vi-oo A Vi-OO i 27 T i_oc J-oo 

Al transformar a coordenadas polares, demuestre que la integral doble precedente es igual a 1 /u. 
Sea Z una variable aleatoria normal estandar y W = (Z 2 + 3Z) 2 . 
a Use los momentos de Z (vea Ejercicio 4.199) para obtener la media de W. 
b Use el resultado dado en el Ejercicio 4.198 para hallar un valor de w tal que P(W ^ tv) a .90. 
Demuestre que T(1 /2) = Vrr al escribir 


4.196 
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4.197 


4.198 


4.199 


4.200 


r(i/2) = 


r 


y~ 1/2 e~ y dy 


al hacer la transformacion y = (1 / 2 )jc 2 y emplear el resultado del Ejercicio 4.194. 
La funcion B(a, /3) esta definida por 


B(a,p) = f y a ~\l -yf-'dy. 
Jo 


a Si y — sen 2 6, demuestre que 


B(a, 


,0) =2 f 

Jo 


r/2 


sen 2 “ _1 6 cos 2/J_1 d dd. 


b Exprese r(a>r(/3) como una integral doble, transforme a coordenadas polares y concluya que 


B{ol, (3) 


r(ajr(/3) 
r(a + p) ' 


La desigualdad Markov Sea g(D una funcion de la variable aleatoria continua Y , con £(|g(y)|) < oo. 
Demuestre que, para toda constante positiva k. 


£(g(L)< i)2l 


E( g(Y) ) 

k 


[Nota: esta desigualdad tambien se cumple para variables aleatorias discretas, con una adaptacion obvia 
en la prueba.] 

Sea Z una variable aleatoria normal estandar. 


a Demuestre que los valores esperados de todas las potencias enteras impares de Z son 0. Esto es, si 
i = 1,2 ,... , demuestre que E(Z 2 ^ 1 ) = 0. [Sugerencia: una funcion g(-) es una. funcion impcir si, para 
toda y, g(-y) = -giy)- Para cualquier funcion impar g(y), g(y) dy = 0, si la integral existe.] 

b Si / = 1.2,..., demuestre que 


E(Z 2i ) 


2,r (*+l) 

Vtt 


[Sugerencia: una funcion h(-) es unafuncion par si, para toda y, h(-y ) = h(y). Para cualquier funcion 
par /;(>'), h(y) dy = 2 h(y) dy, s i l as integrales existen. Use este dato, haga el cambio de 
variable w = z 2 /2 y use lo que sepa acerca de la funcion gamma.] 

c Use los resultados del inciso b y de los Ejercicios 4.81(b) y 4.194 para deducir E(Z 2 ), E(Zf), E{Zf) y 
E{Zf). 

d Si / = 1,2,..., demuestre que 

E(Z 2i ) = f](2j - 1). 

r=i 

Esto implica que el i-esimo momenta par es el producto de los primeros i enteros impares. 

Suponga que Y tiene una distribucion beta con parametros a y f3. 
a Si a es cualquier valor positivo o negativo tal que a + a > 0, demuestre que 

= r(a + a)r(a + l3) 

V ; r(a9r(a: + f3 + a) 


b l,Por que su respuesta al inciso a requirio que a + a > 0? 
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c Demuestre que, con a = 1, el resultado en el inciso a da E(Y) = a /(a + fi). 

d Use el resultado del inciso a para dar una expresion para E{y/y)- iQue necesita para hacer suposi- 
ciones acerca de a? 

e Use el resultado del inciso a para dar una expresion para£(l/Y), E{ 1 /\ r Y), y E(\/Y 2 ). ^Que necesita 
para hacer suposiciones acerca de a en cada caso? 


CAPITULO 5 


Distribuciones de probabilidad 
multivariantes 


5.1 Introduccion 

5.2 Distribuciones de probabilidad bivariantes y multivariantes 

5.3 Distribuciones de probabilidad marginal y condicional 

5.4 Variables aleatorias independientes 

5.5 El valor esperado de una funcion de variables aleatorias 

5.6 Teoremas especiales 

5.7 Covarianza de dos variables aleatorias 

5.8 Valor esperado y varianza de funciones lineales de variables aleatorias 

5.9 Distribucion de probabilidad multinomial 

5.10 Distribucion normal bivariante (opcional) 

5.11 Valores esperados condicionales 

5.12 Resumen 

Bibliograffa y lecturas adicionales 


5.1 Introduccion 

La interseccion de dos o mas eventos es frecuentemente de interes para un experimentador. 
Por ejemplo, un jugador de black-jack esta interesado en el evento de sacar un as y una “figu- 
ra” de una baraja de 52 cartas. Un biologo que observa el numero de animales que sobreviven 
de una camada se preocupa por la interseccion de estos eventos: 

A: la camada contiene n animales. 

B: sobreviven y animales. 

Del mismo modo, observar la estatura y peso de una persona representa la interseccion de un 
par especffico de eventos asociado con medidas de estatura-peso. 
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Lo que es mas importante para expertos en estadfstica son las intersecciones que se pre- 
sentan en el curso de tomar muestras. Suponga que Y v Y 2 , . . . , Y n denota los resultados de 
n intentos sucesivos de un experimento. Por ejemplo, esta secuencia podrfa representar los 
pesos de n personas o las medidas de n caracterfsticas ffsicas para una sola persona. Un con- 
junto especffico de resultados o mediciones muestrales puede ser expresado en terminos de 
la interseccion de los n eventos ( Y x = v,), (Y 2 = y 2 ), . . . , (Y n = y n ), que denotaremos como 
(Vj = Vp Y 2 = y 2 , . . . , Y n = y n ) o bien, de un modo mas compacto, como (y ,, y 2 , . . . , y n ). El 
calculo de la probabilidad de esta interseccion es esencial para hacer inferencias acerca de la 
poblacion de la cual se tomo la muestra y es una razon importante para estudiar distribuciones 
de probabilidad multivariantes. 


5.2 Distribuciones de probabilidad 
bivariantes y multivariantes 

Se pueden definir muchas variables aleatorias sobre el mismo espacio muestral. Por ejemplo, 
considere el experimento de lanzar un par de dados. El espacio muestral contiene 36 puntos 
muestrales, correspondientes a las mn = (6)(6) = 36 formas en las que pueden aparecer nu- 
meros en las caras de los dados. Cualquiera de las siguientes variables aleatorias podrfa estar 
definida sobre el espacio muestral y podrfa ser de interes para el experimentador: 

fj: el numero de puntos que aparecen en el dado 1. 

Y 2 : el numero de puntos que aparecen en el dado 2. 

Yy la suma del numero de puntos en los dados. 

Y 4 : el producto del numero de puntos que aparecen en los dados. 

Los 36 puntos muestrales asociados con el experimento tienen la misma probabilidad y 
corresponden a los 36 eventos numericos (y,, y 2 ). Asf, lanzar un par de numeros 1 es el evento 
sencillo (1, 1). Lanzar un 2 en el dado 1 y un 3 en el dado 2 es el evento sencillo (2, 3). Como 
todos los pares (y x , y 2 ) ocurren con la misma frecuencia relativa, asignamos una probabilidad 
1/36 a cada punto muestral. Para este ejemplo sencillo la interseccion (y,, y 2 ) contiene a lo 
sumo un punto muestral. En consecuencia, la funcion de probabilidad bivariante es 

p(yu yi) = P(J\ = yi, Y 2 = y 2 ) = 1/36, yi = 1, 2,..., 6, y 2 = 1, 2,..., 6. 

En la Figura 5.1 se muestra una grafica de la funcion de probabilidad bivariante para el 
experimento de lanzar dados. Observe que una probabilidad diferente de cero se asigna a un 
punto (jj, y 2 ) del piano si y solo si y x = 1, 2, . . . , 6 y y 2 = 1, 2, . . . , 6. Entonces, a los 36 
puntos del piano se les asignan exactamente probabilidades diferentes de cero. Ademas, las 
probabilidades se asignan en tal forma que la suma de las probabilidades diferentes de cero 
es igual a 1. En la Figura 5.1 los puntos a los que se asignan probabilidades diferentes de ce¬ 
ro estan representados en el piano (y,, \y), mientras que las probabilidades asociadas con estos 
puntos estan dadas por las longitudes de las rectas que aparecen arriba de ellos. La Figura 5.1 
puede verse como histograma teorico de frecuencia relativa en tres dimensiones para los pares 
de observaciones (_v ,, _y 2 ). A1 igual que en el caso discreto de una sola variable, el histograma 
teorico da un modelo para el histograma muestral que se obtendrfa si el experimento de lanzar 
dados se repitiera un gran numero de veces. 
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FIGURA 5.1 
Funcion de probabili¬ 
dad bivariante; 
y-i = numero de 
puntos en el dado 1, 
y 2 = numero de 
puntos en el dado 2 


DEFINICION 5.1 


TEOREMA 5.1 



Sean Y x y Y 2 variables aleatorias discretas. ha funcion de probabilidad conjunta (o biva¬ 
riante) para Fj y Y 2 esta dada por 

p(y\, yf) = P(Y i = yi, Y 2 = y 2 ), -oo < yi < oo, -oo < y 2 < oo. 


En el caso de la variable unica que estudiamos en el Capftulo 3 vimos que la funcion de 
probabilidad para una variable aleatoria discreta Y asigna probabilidades diferentes de cero 
a un numero finito o contable de valores distintos de Y, en forma tal que la suma de las pro¬ 
babilidades es igual a 1. Del mismo modo, en el caso bivariante la funcion de probabilidad 
conjunta p(y v yj) asigna probabilidades diferentes de cero a solo un numero finito o contable 
de pares de valores (y v y 2 ). Ademas, las probabilidades diferentes de cero deben sumar 1. 


Si K, y Y 2 son variables aleatorias discretas con funcion de probabilidad conjunta p(y { , 
y 2 ), entonces 

1 • p(yi> y 2 ) - 0 para toda y v y 2 . 

2. XZ vi v 2 P(}’\’ >’ 2 ) = I , donde la suma es para todos los valores >’ 2 ) a los que se 
asignan probabilidades diferentes de cero. 


A1 igual que en el caso discreto univariante, la funcion de probabilidad conjunta para va¬ 
riables aleatorias discretas a veces se denomina /imcid/z de masa de probabilidad conjunta 
porque especifica la probabilidad (masa) asociada con cada uno de los posibles pares de va¬ 
lores para las variables aleatorias. Una vez que la funcion de probabilidad conjunta se haya 
determinado para variables aleatorias discretas Y x y Y 2 , calcular las probabilidades conjuntas 
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en donde aparecen K, y Y 2 es facil. Para el experimento de lanzar dados, P (2 < < 3, 1 < 

Y 2 2) es 

P(2 < Fi < 3, 1 < Y 2 < 2) = p( 2, 1) + p(2, 2) + p(3, 1) + p{ 3, 2) 

= 4/36 = 1/9. 


EJ EM P LO 5.1 Un supermercado local tiene tres cajas. Dos clientes llegan a las cajas en momentos diferentes 

cuando las cajas no atienden a otros clientes. Cada cliente escoge una caja de manera aleato- 
ria, independientemente del otro. Denote con lj el numero de clientes que escogen la caja 1 y 
con Y 2 el numero que selecciona la caja 2. Encuentre la funcion de probabilidad conjunta de 

Yt y y 2 . 

Solucion Podriamos proceder en muchas formas. La mas directa es considerar el espacio muestral 
asociado con el experimento. Denotemos con el par {/, j } el evento sencillo de que el primer 
cliente escogio la caja i y el segundo cliente escogio la caja j, donde i, j = 1, 2 y 3. Usando la 
regia mn, el espacio muestral esta formado por 3x3 = 9 puntos muestrales. De acuerdo con 
las suposiciones dadas antes, cada punto muestral es igualmente probable y tiene probabilidad 
1 /9. El espacio muestral asociado con el experimento es 

5 = [{1, 1}, {1, 2}, {1, 3}, {2, 1}, {2, 2}, {2, 3}, {3, 1}, {3, 2}, {3, 3}]. 

Observe que el punto muestral {1, 1} es el unico correspondiente a (Yj = 2, Y 2 = 0) y por tanto 
P(Y l = 2, Y 2 = 0) = 1 /9. Del mismo modo, P{Y\ = 1, Y 2 = 1) =P({1, 2} o {2, 1}) = 2/9. 
La Tabla 5.1 contiene las probabilidades asociadas con cada posible par de valores para Lj y 
Y 2 , es decir, la funcion de probabilidad conjunta para lj y Y 2 . Como siempre, los resultados 
del Teorema 5.1 se cumplen para este ejemplo. 


Tabla 5.1 

Funcion de probabilidad para V) y 

' Y 2 , Ejemplo 5.1 



yi 


yz 

0 

l 

2 

0 

1/9 

2/9 

1/9 

l 

2/9 

2/9 

0 

2 

1/9 

0 

0 


A1 igual que en el caso de variables aleatorias univariantes, la distincion entre variables 
aleatorias continuas conjuntas y discretas conjuntas puede ser caracterizado en terminos de 
sus funciones de distribucion (conjuntas). 


DEFINICION 5.2 Para cualesquiera variables aleatorias fj y Y 2 , la funcion de distribucion (bivariante) 
conjunta F(y 2 , y 2 ) es 

F(yi, y 2 ) = P{Y\ ^ yi, Y 2 ^ y 2 ), ~oo < y i < oo, -oo < y 2 < oo. 









5.2 Distribuciones de probabilidad bivariantes y multivariantes 227 



Para dos variables discretas K, y Y 2 , F(y ,, y 2 ) esta dada por 

F{y\,yi) = X! X! 

n==yi 

Para el experimento de lanzar un dado, 

F{ 2, 3) = P{Y\ <2 ,Y 2 <3) 

= p(l, 1) + p(l, 2) + p( 1, 3) + p(2, 1) + p(2, 2) + p(2, 3). 

Como p (y !, y 2 ) = 1 /36 para todos los pares de valores de y ] y y 2 en consideracion, F( 2, 3) = 
6/36 = 1/6. " 

EJEMPLO 5.2 

Considere las variables aleatorias K, y K 2 del Ejemplo 5.1. Encuentre F(-l, 2), F( 1.5, 2) y 
/ (5. 7). 

Solucion 

Usando los resultados de la Tabla 5.1 vemos que 

F(- 1, 2) = P(P, < -1, E 2 < 2) = P(0) = 0. 

Ademas, 

F(1.5, 2) = P(Y X < 1.5, P 2 ^2) 

= p(0, 0) + p( 0, 1) + p(0, 2) + p(l, 0) + p( 1, 1) + p(l, 2) = 8/9. 

De manera similar, 

F(5, 7) = P(7i <5, Y 2 <7) = 1. 

Observe que F(y p y 2 ) = 1 para today,, y 2 tal que min { v,, y 2 } > 2. Tambien, F(yi, y 2 ) = 0 si 
mm{y,, y 2 ) < 0. ■ 

DEFINICION 5.3 

Se dice que dos variables aleatorias son continuas conjuntas si su funcion de distribucion 
conjunta F(y ,, y 2 ) es continua en ambos argumentos. 

Sean K, y Y 2 variables aleatorias continuas con funcion de distribucion conjunta F(y ,, 
y 2 ). Si existe una funcion no negativa/Cv,, yy), tal que 

F(yuy 2 )=[ [ f(h,t 2 )dt 2 dt u 

para toda — oo < y\ < oo, —oo < y 2 < oo, entonces se dice que K, y Y 2 son variables 
aleatorias continuas conjuntas. La funcion f(y ,, y 2 ) recibe el nombre de funcion de den- 
sidad de probabilidad conjunta. 


Las funciones de distribucion acumulativa bivariante satisfacen un conjunto de propieda- 
des similares a las especificadas para funciones de distribucion acumulativa univariante. 
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TEOREMA 5.2 Si K, y Y 2 son variables aleatorias con funcion de distribucion conjunta F(y v y 2 ), enton- 
ces 

1. F(— oo, — oo) = F{— oo, y 2 ) = F{y\, — oo) = 0. 

2. F( oo, oo) = 1. 

3. Si y’j — yi y y 2 — Y 2 , entonces 

F(y\, y 2 ) - F(y*, y 2 ) ~ F(y u y 2 ) + F(y u y 2 ) s 0. 


La parte 3 resulta de que 

F(y\, y 2 ) ~ F(y*, y 2 ) - F(y u y%) + F(y u yi) 

= P(yi < Yi < y*, y 2 <Y 2 < y* 2 ) > 0. 

Observe que F(oo, oo) = lfm r| ^ 0O lim ) , 2 _ >co F(y 1 , v 2 ) = 1 implica que la funcion de densidad 
conjunta /iv,. y 2 ) debe ser tal que la integral de/(y h y 2 ) para todos los valores de (v,, y 2 ) es 1. 


TEOREMA 5.3 


Si Y { y Y 2 son variables aleatorias continuas conjuntas con una funcion de densidad 
conjunta dada por/(y 1; y 2 ), entonces 

1. f(yuyi) & 0 para today!, y 2 . 

2 - IZo n f(y i ,y2)d yi dy 2 = i. 


A1 igual que en el caso continuo univariante que se estudia en el Capftulo 4, la funcion de 
densidad conjunta puede ser interpretada de manera intuitiva como un modelo para el histo- 
grama de frecuencia relativa conjunta para fj y Y 2 . 

Para el caso continuo univariante, las areas bajo la densidad de probabilidad para un inter- 
valo corresponden a probabilidades. De igual manera, la funcion de densidad de probabilidad 
bivariante f(y h y 2 ) traza una superficie de densidad de probabilidad sobre el piano (y 2 , y 2 ) 
(Figura 5.2). 


FIGURA 5.2 
Funcion de densidad 
bivariante f(y v y 2 ) 
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EJEMPLO 5.3 


Solution 


FIGURA 5.3 
Representation 
geometrica 
de f(y u y 2 ), 
Ejemplo 5.3 


Los volumenes bajo esta superficie representan probabilidades. Asf, P(a x < K, < a 2 , b 1 s 
Y 2 s b 2 ) es el volumen sombreado que se ve en la Figura 5.2 y es igual a 



f(yi,yi)dy l dy 2 . 


Suponga que una partfcula radiactiva se localiza aleatoriamente en un cuadrado con lados de 
longitud unitaria. Esto es, si se consideran dos regiones de igual area y dentro del cuadrado 
unitario es igualmente probable que la partfcula se encuentre en cualquiera de las dos. Denote 
con Y 1 y Y 2 las coordenadas de la ubicacion de la partfcula. Un modelo razonable para el his- 
tograma de frecuencia relativa para K, y Y 2 es la analoga bivariante de la funcion de densidad 
uniforme univariante: 


0 <yi < 1,0 <y 2 =£ 1, 

en cualquier otro punto. 

a Trace la superficie de densidad de probabilidad. 
b Encuentre F(. 2, .4). 
c Encuentre P(.l < Y 2 < .3, 0 < Y 2 < .5). 

a El trazo se muestra en la Figura 5.3. 

b F(.2, .4) = f f f(yi, yi) d yi dy 2 

J— oo J— oo 

= [ f (1) dy 1 dy 2 
Jo Jo 

La probabilidad F(. 2, .4) corresponde al volumen bajo /fV], y 2 )= L que esta sombreado en la 
Figura 5.3. Como lo indican consideraciones geometricas, la probabilidad deseada (volumen) 
es igual a .08, que obtuvimos mediante integration al principio de esta section. 


/(vi, y 2 ) = 



y 2 
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c 


P(.l < Yi < .3,0 < Y 2 < .5) 



f(y\,yi)dy t dy 2 
1 dy l dv 2 = ■ 10. 


Esta probabilidad corresponde al volumen bajo la funcion de den si dad /(y,, y 2 ) = 1 que < 2 sta 
arriba de la region .1 < v, < .3. 0 < v 2 < .5. Al igual que la solucion del inciso b, la solucion 
actual se puede obtener con el uso de conceptos de geometrfa elemental. La densidad o altura 
de la superficie es igual a 1 y por tanto la probabilidad deseada (volumen) es 

P(. 1 <.3,0<E 2 ^.5) =(.2)(.5)(1) = .10. ■ 


En el siguiente ejemplo se ilustra un modelo bivariante ligeramente mas complicado. 


EJEMPLO 5.4 Sehade almacenar gasolina en un enorme tanque una vez al principio de cada semana y luego se 
vende a clientes individuales. Denote con Y x el nivel de gasolina (proporcion) que alcanza 
el tanque despues de surtirlo. Debido a suministros limitados, Fj varia de una semana a otra. 
Denote con Y 2 la proporcion de la capacidad del tanque que se vende durante la semana. Como 
Y j y Y 2 son proporciones, estas dos variables toman valores entre 0 y 1. Ademas, la cantidad 
de gasolina vendida, y 2 , no puede ser mayor que la cantidad disponible, y ,. Suponga que la 
funcion de densidad conjunta para Y ] y Y 2 esta dada por 


f(y i> yi) 


3yi, o < y 2 s yi < 1 , 

0, en cualquier otro punto. 


En la Figura 5.4 se muestra una grafica de esta funcion. 

Encuentre la probabilidad de que menos de la mitad del tanque tenga gasolina y mas de un 
cuarto del tanque se venda. 

Solucion Buscamos P (0 < Y l < .5, Y 2 > .25). Para cualquier variable aleatoria continua, la probabili¬ 

dad de observar un valor en una region es el volumen bajo la funcion de densidad por arriba 
de la region de interes. La funcion de densidad f(y { , y 2 ) es positiva solo en la region triangular 


FIGURA 5.4 
Funcion de densidad 
conjunta para el 
Ejemplo 5.4 


f(.y v y 2 ) 



■L 


>2 
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grande del piano (y 1? y 2 ) que se ve en la Figura 5.5. Estamos interesados solo en valores de Vj y 
y 2 tales que 0 < y, < .5 y y 2 > -25. La interseccion de esta region y la region donde la funcion 
de densidad es positiva esta dada por el pequeno triangulo (sombreado) de la Figura 5.5. En 
consecuencia, la probabilidad que deseamos es el volumen bajo la funcion de densidad de la 
Figura 5.4 arriba de la region sombreada del piano (v,, y 2 ) que se ve en la Figura 5.5. 

Entonces, tenemos 


P(0 < Y x < .5, .25 < Y 2 ) = 


r 1/2 ry i 

/ / 3yi dy 2 dy x 

J 1/4 J 1/ 


/1/4 J 1/4 
' 1/2 


L 3,1 dyt 

l 


1/4 

1/2 


3yi(yi - 1/4) dyi 


= [y? - (3/8 )y 2 1 ] 


1/2 


1/4 


[(1/8) - (3/8)( 1/4)] - [(1/64) - (3/8)(l/16)] 
5/128. 


El calculo de la probabilidad especificada en el Ejemplo 5.4 comprendio integrar la funcion 
de densidad conjunta para K, y Y 2 sobre la region apropiada. La especificacion de los limites de 
integracion se hizo mas facil al trazar la region de integracion en la Figura 5.5. Este meto- 
do, trazando la region apropiada de integracion, con frecuencia facilita establecer la integral 
apropiada. 

Los metodos estudiados en esta seccion se pueden usar para calcular la probabilidad de la 
interseccion de dos eventos (K, = y h Y 2 = y 2 ). De igual modo podemos definir una funcion 
de probabilidad (o funcion de densidad de probabilidad) para la interseccion de n eventos 
(Fj = V|, Y 2 = y 2 ,. . . , Y n = y n ). La funcion de probabilidad conjunta correspondiente al caso 
discreto esta dada por 


p(yu yi, ■ ■ ■, y n ) = P(Y I = yu Y 2 = y 2 . Y„ = y„). 

La funcion de densidad conjunta de fj, Y 2 ,... ,Y n esta dada por /(}-,, y 2 , . . . , y n ). Al igual 
que en el caso bivariante, estas funciones dan modelos para las distribuciones de frecuencia 
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relativa conjunta de las poblaciones de observaciones conjuntas (y,, y 2 , ■ ■ ., y„) para el caso 
discreto y el caso continuo, respectivamente. En el caso continuo, 


P(Y i <yi ,L 2 <y 2 ,..., Y„ < y„) 


F(y u ..., y„) 

/ yi ryi ry n 

/ ■■■/ f(tut2,...,t n )dt n ...dh 

-oo J—oo J— OO 


para todo conjunto de numeros reales (y ,, y 2 , . . ., y n ). Las funciones de distribution multiva¬ 
riantes definidas por esta igualdad satisfacen propiedades semejantes a las especificadas para 
el caso bivariante. 


Ejercicios 

5.1 Los contratos para dos trabajos de construction se asignan aleatoriamente a una o mas de tres empresas, 
A, B y C. Denote con F t el numero de contratos asignados a la empresa A y Y 2 el numero de contratos 
asignados a la B. Recuerde que cada empresa puede recibir 0, 1 o 2 contratos. 

a Encuentre la funcion de probabilidad conjunta para Fj y F 2 . 
b Encuentre F(l, 0). 

5.2 Tres monedas balanceadas se lanzan en forma independiente al aire. Una de las variables de interes es Y v 
el numero de caras. Denote con Fi la cantidad de dinero ganado en una apuesta colateral en la siguiente 
forma. Si la primera cara aparece en el primer tiro, usted gana $1. Si la primera cara aparece en el tiro 2 o 
en el 3 usted gana $2 o $3, respectivamente. Si no aparece una cara, usted pierde Si (esto es, gana —$ 1). 

a Encuentre la funcion de probabilidad conjunta para Y 1 y F 2 . 

b ^Cual es la probabilidad de que haya menos de tres caras y usted gane $1 o menos? [Esto es, encuen¬ 
tre F(2, 1).] 

5.3 De nueve ejecutivos de una empresa financiera, cuatro estan casados, tres nunca se han casado y dos 
estan divorciados. Tres de los ejecutivos se han de seleccionar para un ascenso. Denote con F t el numero 
de ejecutivos casados y con F 2 el numero de ejecutivos que no se han casado entre los tres seleccionados 
para el cargo. Suponiendo que los tres se seleccionan aleatoriamente de entre los nueve disponibles, 
encuentre la funcion de probabilidad conjunta de F, y F 2 . 

5.4 A continuation se da la funcion de probabilidad conjunta asociada con datos obtenidos en un estudio de 
accidentes automovilisticos en los que un nino (de menos de 5 anos de edad) estaba en el auto y hubo al 
menos una persona muerta. Especificamente, el estudio se concentre en si el nino sobrevivio y que tipo 


de cinturon de seguridad (si lo habia) utilizaba. Defina 





0 , 

si no usaba cinturon, 

f 0 , 

si el nino sobrevivio, 

Yi= , 

II 

1 , 

si usaba cinturon para adulto, 

l 1 - 

si no, 

2, 

si usaba cinturon del asiento del auto. 


Observe que Fj es el numero de fallecimientos por nino y, como los asientos para ninos del auto tienen 
por lo general dos cinturones, F, es el numero de cinturones de seguridad que se usaban en el momenta 
del accidente. 


yi 


yi 

0 

1 

Total 

0 

.38 

.17 

.55 

1 

.14 

.02 

.16 

2 

.24 

.05 

.29 


Total .76 .24 1.00 
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a Verifique que la funcion de probabilidad precedente satisface al Teorema 5.1. 
b Encuentre F(l, 2). ^Cual es la interpretation de este valor? 

5.5 Consulte el Ejemplo 5.4. La densidad conjunta de F 15 la proporcion de la capacidad del tanque que se 
abastece al principio de la semana, y Y 2 , la proporcion de la capacidad vendida durante la semana, esta 
dada por 

[ 3yi, 0 sj 2 <)ii<l, 

f(y i, yi) = \ 

I 0, en cualquier otro punto. 


a Encuentre F( 1/2, 1/3) = P(Y 1 < 1/2, Y 2 < 1 /3). 

b Encuentre P(Yi £ Fj/2), la probabilidad de que la cantidad vendida sea menor que la mitad de la 
cantidad comprada. 

5.6 Consulte el Ejemplo 5.3. Si una partfcula radiactiva se selecciona aleatoriamente en un cuadrado de 
longitud unitaria, un modelo razonable para la funcion de densidad conjunta para Y 1 y Y 2 es 


f(y u yi) 


[ 1, 0 <y! <1,0 <y 2 <1, 

I 0, en cualquier otro punto. 


a ,',Cual es P(F, -Y 2 > .5)? 
b ^Cual es P(Y l Y 1 < .5)? 

5.7 Supongamos que F, y F 2 tienen la funcion de densidad conjunta 


f c -(3’i+y2) j yj > 0, y 2 >0, 

f(yuY2) = ] 

I 0, en cualquier otro punto. 

a <■ Cual es P(F, <1, y 2 > 5)? 
b iCual es P(Y I + Y 2 < 3)? 

5.8 Tengan fj y Y 2 una funcion de densidad de probabilidad conjunta dada por 

{ ky { y 2 , 0 < 1,0 < y 2 < 1, 

f(y i, yz) = i _ 

I 0, en cualquier otro punto. 

a Encuentre el valor de k que haga de esta una funcion de densidad de probabilidad. 
b Encuentre la funcion de distribution conjunta para Y t y F,. 
c Encuentre P(Y l < 1 /2, F 2 < 3/4). 

5.9 Tengan Y l y F 2 una funcion de densidad de probabilidad conjunta dada por 

f k{ 1 -y 2 ), 0 <y! <y 2 ^ 1, 

f(y i,F2) = 

10, en cualquier otro punto. 

a Encuentre el valor de k que haga de esta una funcion de densidad de probabilidad. 
b Encuentre P(Y 1 < 3/4, F 2 > 1/2). 

5.10 Un ingeniero ambiental mide la cantidad (en peso) de partlculas contaminantes en muestras de aire de 
cierto volumen recolectado en dos chimeneas en una planta de energfa alimentada con carbon. Una de las 
chimeneas esta equipada con un aparato limpiador. Denote con Fj la cantidad de contaminante por 
muestra recolectada arriba de la chimenea que no tiene aparato limpiador y denote con F 2 la cantidad 
de contaminante por muestra recolectada arriba de la chimenea que esta equipada con el aparato lim¬ 
piador. 
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Suponga que el comportamiento de frecuencia relativa de Y l y Y 2 puede ser modelado por 

l 0, en cualquier otro punto. 

Esto es, Kj y Y 2 estan uniformemente distribuidas sobre la region dentro del triangulo limitado por 

Yi = 2 > y 2 = 0 y 2 Yi = Vi- 

a Encuentre el valor de k que haga de esta una funcion de densidad de probabilidad. 
b Encuentre P(Y l S 3F 2 ). Esto es, encuentre la probabilidad de que el aparato limpiador reduzca la 
cantidad de contaminante en un tercio o mas. 

5.11 Suponga que Y t y Y 2 estan uniformemente distribuidas sobre el triangulo sombreado del siguiente 
diagrama. 



a Encuentre P(Y 2 < 3/4, F 2 < 3/4). 
b Encuentre P(Y 1 - Y 2 > 0). 

5.12 Denote con fj y Y 1 las proporciones de dos tipos diferentes de componentes en una muestra provenien- 
te de una mezcla de productos quimicos usados como insecticida. Suponga que Y t y Y 2 tienen la funcion 
de densidad conjunta dada por 

f(yi y 2 ) = I 2 ’ 0 - Ei - 0 - E2 ^ E ° ^ Ei + E2 ^ E 

( 0, en cualquier otro punto. 


(Observe que Y l + Y 2 £ 1 porque las variables aleatorias denotan proporciones dentro de la misma 
muestra.) Encuentre 

a P(Y { < 3/4, Y 2 < 3/4). 
b P(Y { < 1/2, y 2 < 1/2). 

5.13 La funcion de densidad conjunta de 1/ y Y 2 esta dada por 


f(yu yi) 


30yiy|, >1 - 1 < 1 - yi,0Syi < 1, 

0, en cualquier otro punto. 


a Encuentre F( 1/2, 1 /2). 
b Encuentre F( 1/2, 2). 
c Encuentre P(Y 1 > Y 2 ). 

5.14 Suponga que las variables aleatorias Y { y Y 2 tienen funcion de densidad de probabilidad conjunta f(v 1 , 
y 2 ) dada por 

f (yi y 2 ) = ^y\yi' 0 - yi - yz> yi + yi - 2 - 

0, en cualquier otro punto. 


a Verifique que esta es una funcion de densidad conjunta valida. 
b ^.Cual es la probabilidad de que Y 1 + Y 2 sea menor que 1? 
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5.15 La administration en un restaurante de comida rapida esta interesada en el comportamiento conjunto 
de las variables aleatorias Fj, definidas como el tiempo total entre la llegada de un cliente a la tienda y 
la salida de la ventanilla de servicio y Y 2 , el tiempo que un cliente espera en la fila antes de llegar a la ven- 
tanilla de servicio. Como Y 1 incluye el tiempo que un cliente espera en la fila, debemos tener F t S Y 2 . 
La distribution de frecuencia relativa de valores observados de Fj y Y 2 puede ser modelada por la fun- 
cion de densidad de probabilidad 


f{yi,yi) 


e n , 0 £ y 2 ^ yi < oo, 

0, en cualquier otro punto 


con el tiempo medido en minutos. Encuentre. 


a P(Y l <2,Y 2 > 1). 
b P(F,>2F 2 ). 

c P(Y l - Fj — !)■ (Observe que Y 1 - Y 2 denota el tiempo que se pasa en la ventanilla de servicio.) 

5.16 Denote con Fj y F 2 las proporciones de tiempo (en un dla habil) durante las cuales los empleados I y II, 
respectivamente, realizan sus tareas asignadas. El comportamiento de frecuencia relativa conjunta de F, 
y F 2 esta modelado por la funcion de densidad 


f(yi, yi) 


yi + y 2 , 0 <yi < 1, 0 <y 2 < 1, 

0, en cualquier otro punto. 


a Encuentre P(Y t < 1/2, F 2 > 1/4). 
b Encuentre P(Y l + F 2 < 1). 

5.1 7 Denote con (F l5 F 2 ) las coordenadas de un punto seleccionado aleatoriamente dentro de un clrculo uni- 
tario cuyo centra esta en el origen. Esto es, Fj y F 2 tienen una funcion de densidad conjunta dada por 


f(y l, yi) 



y\ + y\ ^ i. 

en cualquier otro punto. 


Encuentre P(Fj < F 2 ). 

5.18 Un sistema electronico tiene uno de cada dos tipos diferentes de componentes en operation conjunta. 
Denote con F, y F 2 las duraciones aleatorias de los componentes del tipo I y tipo II, respectivamente. La 
funcion de densidad conjunta esta dada por 


[ (l/8)y 1 e _(yi+; «> /2 , y\ > 0, y 2 > 0, 
/(F1.F2) = 1 

[0, en cualquier otro punto. 

(Las mediciones son en cientos de horas.) Encuentre P(Y 1 > 1, F 2 > 1). 


5.3 Distribuciones de probabilidad 
marginal y condicional 

Recuerde que los valores distintos tornados por una variable aleatoria discreta representan even- 
tos mutuamente excluyentes. De manera analoga, para todos los distintos pares de valores y : , 
y 2 , los eventos bivariantes (Y { = y,, Y 2 = y 2 ), representados por (y,. y 2 ), son eventos mutuamen¬ 
te excluyentes. Se deduce que el evento univariante (F, = y,) es la union de eventos bivariantes 
del tipo (Fj = y v Y 2 = y 2 ), con la union tomada para todos los posibles valores de y 2 . 
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DEFINICION 5.4 


Por ejemplo, reconsidere el experimento de tirar un dado de la Seccion 5.2, donde 
Y l = numero de puntos de la cara superior del dado 1, 

Y 2 = numero de puntos de la cara superior del dado 2. 

Entonces 

P(Y l =l)=p(l, l)+p(l, 2) + p(l, 3) + . . . + p(l, 6) 

= 1/36 + 1/36 + 1/36 + . . . + 1/36 = 6/36 = 1/6 

P{Y X =2) = p(2, 1) + p(2, 2) + p( 2, 3) + . . , + p(2, 6) = 1/6 


P(Yi = 6) = p{ 6, 1) + p{ 6, 2) + p{ 6, 3) + . . , + p( 6, 6) = 1/6. 

Expresadas en notation de sumatoria, las probabilidades acerca de la variable Y { sola son 

6 

P(Yi = ji) = piiyi) = ^2 p{y\, yi). 

3'2 = l 

Del mismo modo, las probabilidades correspondientes a valores de la variable Y 2 sola estan 
dadas por 

6 

Piiyi) = p(y 2 = yi) = ^2 p(yu yi)- 

yi=i 

La sumatoria en el caso discreto corresponde a la integracion en el caso continuo, que nos 
lleva a la siguiente definicion. 


a Sean Y t y Y 2 variables aleatorias discretas conjuntas con funcion de probabilidad p(y { , 
y 2 ). Entonces las funciones de probabilidad marginal de Y ] y Y 2 , respectivamente, 
estan dadas por 

piiyi) = Xlp(:yi> yi) y piiyi) = ^p(yi, yi)- 

todos y>2 todos _yi 

b Sean Y ] y Y 2 variables aleatorias continuas conjuntas con funcion de densidad con- 
junta /( V|, y 2 ). Entonces las funciones de densidad marginal de K, y Y 2 , respectiva¬ 
mente, estan dadas por 

/ OO POO 

f(y\ , yi) dy 2 y f 2 (y 2 )= f(yuy 2 )dy l . 

-oo J —OO 


El termino marginal , como se aplica a las funciones de probabilidad univariante de Y l y Y 2 , 
tiene significado intuitivo. Para hallar pfyi), sumamos p(y x , y 2 ) para todos los valores de y 2 
y por tanto acumulamos las probabilidades en el eje y j (o margen). Los casos discretos y con- 
tinuos se ilustran en los siguientes dos ejemplos. 
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EJEMPLO 5.5 De un grupo de tres republicanos, dos democratas y uno independiente se ha de seleccionar 
aleatoriamente un comite de dos personas. Denote con fj el numero de republicanos y con Y 2 
el numero de democratas del comite. Encuentre la funcion de probabilidad conjunta de lj y 
Y 2 y luego encuentre la funcion de probabilidad marginal de Fj. 


Solucion 


Las probabilidades buscadas aquf son semejantes a las probabilidades hipergeometricas del 
Capftulo 3. Por ejemplo, 


P(Y ! = 1 ,Y 2 = 1) = />(!, 1) 



3(2) _ 6 
15 15 


debido a que hay 15 puntos muestrales igualmente probables; para el evento en cuestion de- 
bemos seleccionar un republicano de entre los tres, un democrata de entre los dos y cero inde- 
pendientes. Calculos semejantes llevan a las otras probabilidades que se ven en la Tabla 5.2. 

Para hallar /j/y,), debemos sumar los valores de Y 2 , como indica la Definicion 5.4. Por 
tanto, estas probabilidades estan dadas por los totales de columna de la Tabla 5.2. Esto es, 


p i(0) = p( 0, 0) + p( 0, 1) + p( 0, 2) = 0 + 2/15 + 1/15 = 3/15. 


Del mismo modo. 


Prd) = 9/15 y p x (2) = 3/15. 

En forma analoga, la funcion de probabilidad marginal de Y 2 esta dada por los totales de fila. 


Tabla 5.2 Funcion de probabilidad conjunta para Vj y Y 2 , Ejemplo 5.5 


yr 

0 

yi 

1 

2 

Total 

0 

0 

3/15 

3/15 

6/15 

1 

2/15 

6/15 

0 

8/15 

2 

1/15 

0 

0 

1/15 

Total 

3/15 

9/15 

3/15 

1 


EJEMPLO 5.6 Sea 


f(y i, yi) 


j 2yi, 0 < yi < 1,0 < y 2 ^ 1, 

l 0, en cualquier otro punto. 


Grafique /'(V|, y 2 ) y encuentre las funciones de densidad marginal para lj y Y 2 . 


Solucion Geometricamente, f(y 1 , y 2 ) describe una superficie en forma de cuna, como se ve en la Figura 
5.6. 

Antes de aplicar la definicion 5.4 para hallar /jfyq) y / 9 (y 9 ), usaremos la Figura 5.6 para 
visualizar el resultado. Si la probabilidad representada por la cuna estuviera acumulada en el 
eje y, (acumulando probabilidad a lo largo de lfneas paralelas al eje y 2 ), el resultado serfa una 
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F I G U R A 5.6 
Representation 
geometrica 
de f(y u y 2 ), 
Ejemplo 5.6 



densidad de probabilidad triangular que se vena como el lado de la cuna de la Figura 5.6. Si 
la probabilidad estuviera acumulada a lo largo del eje y 2 (acumulandose a lo largo de lineas 
paralelas al eje v,), la densidad resultante seria uniforme. Confirmaremos estas soluciones 
visuales mediante la aplicacion de la Definicion 5.4. Entonces, si 0 < v, s 1, 

/ OO P 1 

f(yu y 2 )dy 2 = / 

-co J 0 

y si y x < 0 o y 1 > 1, 

/ OO P 1 

f(yu yi)dy 2 = 0dy 2 =0. 

-oo J 0 


2yi dy 2 = 2yj y 2 


■w 


Entonces, 


fdyi) 


2yi, 0 < yi < 1, 

0, en cualquier otro punto. 


Del mismo modo, si 0 < y 2 < 1, 


L 


fliyi) = / f(yu yi)dy x = / 2y l dy l =y\ 


f 


= 1 


ysiy 2 <0oy 2 > 1, 


Resumiendo, 


i 


fliyi) = / fiyi,yi)dyi = I Ody^O. 


f 


fliyi) 


1, 0 s y 2 s 1, 

0, en cualquier otro punto. 


Las graficas de y f 2 iy 2 ) trazan densidades de probabilidad triangulares y uniformes, 

respectivamente, como es de esperarse. ■ 


Llevemos ahora nuestra atencion a distribuciones condicionales, viendo primero al caso 
discreto. 

La ley multiplicativa (Seccion 2.8) da la probabilidad de la intersection A Pi B como 

P(A n B) = P(A)P(B\A), 
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donde P(A ) es la probabilidad incondicional de A y P(B\A) es la probabilidad de B dado que A 
ha ocurrido. Ahora considere la interseccion de los dos eventos numericos, (Y l = y ,) y (K 2 = 
y 2 ), representada por el evento bivariante (y,, y 2 ). Se deduce directamente de la ley multipli- 
cativa de probabilidad que la probabilidad bivariante para la interseccion (jq, y 2 ) es 

p{y\,yi) = p\{y\)p(yi\y\) 

= P2(y2)p(y\\yi)- 

Las probabilidades pfy i) y p 2 (y 2 ) estan asociadas con las distribuciones de probabilidad 
univariantes para K 1 y Y 2 individualmente (recuerde el Capitulo 3). Usando la interpretacion 
de probabilidad condicional estudiada en el Capitulo 2, piy^y-^) es la probabilidad de que la 
variable aleatoria Y x sea igual a v,, dado que Y 2 toma el valor y 2 . 


DEFINICION 5.5 


Si Yj y K 2 son variables aleatorias discretas conjuntas con funcion de probabilidad con- 
junta p(y i, y 2 ) y funciones de probabilidad marginal p , (y , ) y p 2 (y 2 ), respectivamente, 
entonces la funcion de probabilidad discreta condicional de lj dada Y 2 es 


P(yi\y 2 ) = P(Y\ = y\\Y 2 = yi) 


P(Y\ = yi, Y 2 = y 2 ) 
P(Y 2 = y 2 ) 


p(yu yi) 
P2(y2) 


siempre que p 2 (y 2 ) > 0. 


Entonces, P(Y 1 = 2| Y 2 = 3) es la probabilidad condicional de que K, = 2 dado que Y 2 = 3. 
Una interpretacion similar se puede unir a la probabilidad condicional p(y-\y^). Observe que 
P(y’\ \y 2 1 es indefinida si p 2 (y 2 ) = 0. 


EJEMPLO 5.7 Consulte el Ejemplo 5.5 y encuentre la distribucion condicional de Yj dado que Y 2 = 1. Esto 

es, dado que una de las dos personas del comite es democrata, encuentre la distribucion con¬ 
dicional para el numero de republicanos seleccionados para el comite. 


Solucion Las probabilidades conjuntas estan dadas en la Tabla 5.2. Para hallar p(y 1 \ Y 2 = 1), nos concen- 
tramos en la fila correspondiente a Y 2 = 1. Entonces 


y 


p (Yi =o|y 2 = i) 
P(Yl = l\y 2 = 1 ) 


P(Yi S2|F 2 = 1) 


p( 0, 1) _ 2/15 _ 1 


P2(l) 

8/15 

P( 1, 1) 

6/15 

P2(l) 

8/15 

p(2, 1) 

0 

Pl(i) 

8/15 


En el comite seleccionado aleatoriamente, si una persona es democrata (o, lo que es lo mismo, 
si Y 2 = 1), hay una alta probabilidad de que el otro sea republicano (o sea Y l = 1). 
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DEFINICION 5.6 


En el caso continuo podemos obtener una analogia apropiada de la funcion de probabilidad 
condicional /? 1^! I^), pero no se obtiene en una forma tan sencilla. Si Y l y Y 2 son continuas, 
P(Y l = j’ 1 1 Y 2 = yy) no se puede definir como en el caso discreto porque (F, = y , ) y (Y 2 = y 2 ) 
son eventos con probabilidad cero. Las siguientes consideraciones, sin embargo, llevan a una 
definicion util y consistente para una funcion de densidad condicional. 

Suponiendo que Y t y Y 2 son continuas conjuntas con funcion de densidad f(y v y 2 ), podrfa- 
mos estar interesados en una probabilidad de la forma 

P{Y\ ^ yi|F 2 = y 2 ) = E(yi|y 2 ), 

que, como funcion de y, para una y 2 fija, se denomina funcion de distribution conditional de 
Yj, dado que F, = y 2 . 


Si Y ] y Y 2 son variables aleatorias continuas conjuntas con funcion de densidad conjunta 
f(y v y 2 ), entonces la funcion de distribution condicional de F, dado que Y 2 = y 2 es 

F(yi\n) = P{Yi^y\\Y2 =yi). 


Observe que /'’(y 1 |y 2 ) es una funcion de y, para un valor fijo de y 2 . 

Si pudieramos tomar F(yy\y 2 ), multiplicarlo por P(Y 2 = yy) para cada posible valor de Y 2 y 
sumar todas las probabilidades resultantes, podriamos obtener /*'(>’]). Esto no es posible por¬ 
que el numero de valores para yy es incontable y todas las probabilidades P(Y 2 = yy) son cero. 
Pero podemos hacer algo analogo al multiplicarlo por f 2 (y 2 ) y luego integrar para obtener 

/ OO 

F{y\\y2)f2(y2)dy 2 . 

-oo 

La cantidad f 2 (y 2 )dy 2 se puede considerar como la probabilidad aproximada de que Y 2 tome un 
valor en un pequeno intervalo alrededor de y 2 , y la integral es una suma generalizada. 

Ahora, de consideraciones previas, sabemos que 


/ y i ry\ r /•oo 

Mh)dti = / f(t u yi)dy 2 

-oo J— OO _J — OO 


dt\ 


/ oo p 

-oo J — c 


/(ft, yi)dt\ dy 2 . 


De estas dos expresiones para F(y j), debemos tener 


o bien 


F(yi\y 2 )f 2 (y 2 ) = 



f(h, y 2 )dti 


F(yi\y 2 ) = 



f(h, Y2) 

fiiyi) 


dt\. 


Al integrando de esta expresion lo llamaremos funcion de densidad condicional de Y t dado 
que Y 2 = y 2 , y lo denotaremos por/(yj|y 2 ). 
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DEFINICION 5.7 


EJEMPLO 5.8 


Solucion 


Sean Y 1 y Y 2 variables aleatorias continuas conjuntas con densidad conjunta/(V|. y 2 ) y 
densidades marginales/j^) y/ 2 (y 2 )> respectivamente. Para cualquier y 2 tal que/ 2 (y 2 ) 
> 0, la densidad condicional de Y ] dada Y 2 = y 2 esta dada por 

fiyu yi) 


f(y\\yi) = 


fiiyi) 


y, para cualquier y, tal que /' l (v l )> 0, la densidad condicional de Y 2 dada K, 
dada por 


f(yi\yi) 


f(yu yi) 
Mvi) 


y j esta 


Observe que la densidad condicional/(yjy,) es indefinida para toda y 2 tal que / 2 (y 2 ) = 0. 
Del mismo modo,/^.,^) es indefinida si Vj es tal que/jlyq) = 0. 


Una maquina automatica expendedora de bebidas tiene una cantidad aleatoria Y 2 de bebida en 
existencia al principio de un dfa determinado y dosifica una cantidad aleatoria K, durante el 
dfa (con cantidades expresadas en galones). La maquina no se reabastece durante el dfa y, en 
consecuencia, Y 2 < Y 2 . Se ha observado que Lj y Y 2 tienen una densidad conjunta dada por 

f 1/ 2, 0 < yi < y 2 < 2, 

f{yuy2) = L . . t 

( 0, en cualquier otro punto. 

Esto es, los puntos (y,, y 2 ) estan uniformemente distribuidos en el triangulo con las fronteras 
dadas. Encuentre la densidad condicional de K, dada K 2 = y 2 . Evalue la probabilidad de que se 
venda menos de 1 /2 galon, dado que la maquina contiene 1.5 galones al empezar el dfa. 


La densidad marginal de Y 2 esta dada por 


/- 


Entonces, 


fiiyi) = 


hiyi) = / f(yu yi)dy l . 


/" 2 (1/2)z/v i = (l/2)y 2 , 0<y 2 <2, 

Jo 


f 


0 dy x = 0, 


en cualquier otro punto. 


Observe que/ 2 (y 2 ) > 0 si y solo si 0 < y 2 < 2. Entonces, para cualquier 0 < y 2 < 2, usando 
la Definicion 5.7, 


f(yi\yi) = 


f(y i, yi) 


1/2 


l 

yi 


o ^ yi ^ y 2 . 


fliyi) (1/2 )(y 2 ) 

Tambien./^vJvj) es indefinida si y 2 < 0 o y 2 > 2. La probabilidad de interes es 


P{ Yi 


/ 1/2 

f(yi\y 2 = 1-5 )dy l 

-oo 



Y75 dy ' 


1/2 _ 1 
T5 _ 3' 









242 Capftulo 5 Distribuciones de probabilidad multivariantes 


Si la maquina contiene 2 galones al empezar el dfa, entonces 

, C ' 1 1 1 

P(y 1 <l/2|r 2 =2) = J - dy 3 = 

Por tanto, la probabilidad condicional de que F, < 1/2 dado que Y 2 
apreciable dependiendo de la selection particular de y 2 . 


y 2 cambia de manera 


Ejercicios 

5.19 En el Ejercicio 5.1 determinamos que la distribution conjunta de F l5 el numero de contratos otorgados 
a la empresa A, y Y 2 , el numero de contratos otorgados a la empresa B, esta dada por las entradas en la 
siguiente tabla. 


yi 


Ft 


0 

1 

2 

0 

1/9 

2/9 

1/9 

i 

2/9 

2/9 

0 

2 

1/9 

0 

0 


a Encuentre la distribution de probabilidad marginal de Y 1 . 

b De acuerdo con los resultados vistos en el Capftulo 4, 1/ tiene una distribution binomial con n = 2 y 
p = 1/3. ^Hay algun conflicto entre este resultado y la respuesta dada en el inciso a? 

5.20 Consulte el Ejercicio 5.2. 

a Obtenga la distribution de probabilidad marginal para sus ganancias en la apuesta colateral, 
b ^Cual es la probabilidad de que obtenga tres caras, dado que gano SI en la apuesta colateral? 

5.21 En el Ejercicio 5.3 determinamos que la distribution de probabilidad conjunta de Y v el numero de eje- 
cutivos casados, y F 2 , el numero de ejecutivos que nunca se han casado, esta dada por 



donde y 3 y y 2 son enteros, 0 £ y 1 £ 3, 0 £ y 2 £ 3 y 1 £ + y,, £ 3. 

a Encuentre la distribution de probabilidad marginal de Fj, el numero de ejecutivos casados de entre 
los tres seleccionados para promotion, 
b Encuentre P{Y l = 1|F 2 = 2). 

c Si con F 3 denotamos el numero de ejecutivos divorciados de entre los tres seleccionados para el car¬ 
go, entonces Y 3 = 3 - Y l - Y 2 . Encuentre P(Y 3 = 1|F 2 = 1). 
d Compare la distribution marginal que obtuvo en a con las distribuciones hipergeometricas con N = 9, 
n = 3 y r = 4 encontradas en la Section 3.7. 

5.22 En el Ejercicio 5.4 nos dieron la siguiente funcion de probabilidad conjunta para 


F, = 


0, si el nino sobrevive, 

1, si el nino no sobrevive, 


y Yi 


0 , 

1 , 

2 , 


si no usaba cinturon, 

si usaba cinturon para adulto, 

si usaba el cinturon del asiento del auto. 
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y-i 

Ei 

0 

1 

Total 

0 

.38 

.17 

.55 

l 

.14 

.02 

.16 

2 

.24 

.05 

.29 

Total 

.76 

.24 

1.00 


a Proporcione las funciones de probabilidad marginal para Ej y E 2 . 
b Proporcione la funcion de probabilidad condicional para Y 2 dado que Ej = 0. 

c ^Cual es la probabilidad de que un nino sobreviva dado que llevaba puesto el cinturon del asiento del 
auto? 

5.23 En el Ejemplo 5.4 y el Ejercicio 5.5 consideramos la densidad conjunta de E,, la proporcion de la capa- 
cidad del tanque que se abastece al principio de la semana, y Y 2 , la proporcion de la capacidad vendida 
durante la semana, dada por 

l 3yi, 0 < y 2 ss yi =£ 1, 

/(.Vi, E2) = \ 

l 0, en cualquter otro punto. 


a Encuentre la funcion de densidad marginal para Y 2 . 
b ^Para que valores de y 2 esta definida la densidad condicional/(y 1 |y 2 )? 

c ^Cual es la probabilidad de que mas de la mitad del tanque se venda dado que se abastecen tres cuar- 
tas partes del tanque? 

5.24 En el Ejercicio 5.6 supusimos que si una partlcula radiactiva se coloca aleatoriamente en un cuadrado con 
lados de longitud unitaria, un modelo razonable para la funcion de densidad conjunta para fj y Y 2 es 


f(yu yi) 


1, 0 <yi < 1,0 <y 2 £ 1, 

0, en cualquier otro punto. 


a Encuentre las funciones de densidad marginal para Y 1 y E 2 . 
b iCual es P (.3 < Y 1 < .5)? iP (.3 <Y 2 < .5)? 

c ^Para que valores de y 2 esta definida la densidad condicional/(y 1 |v 2 )? 

d Para cualquier y 2 , 0 < y 0 < 1, ^cual es la funcion de densidad condicional de E t dado que E, = y 2 ? 
e Encuentre P(. 3 < E t < .5|E 2 = .3). 
f Encuentre P (.3 < E t < ,5|E 2 = .5). 

g Compare las respuestas que obtuvo en los incisos a, d y e. Para cualquier y 2 , 0 £ y 2 — 1 t,como se 
compara P (.3 < E, < .5) con P (.3 < Y l < ,5|E 2 = y 2 )? 

5.25 Considere que E t y E 2 tienen la funcion de densidad conjunta encontrada primero en el Ejercicio 5.7: 

l e -(yi +yi)^ y!>0, y 2 >0, 

/(Ei, ,V 2 ) = \ 

I 0, en cualquier otro punto. 

a Encuentre las funciones de densidad marginal para Ej y E 2 . Identifique estas densidades como una de 
las estudiadas en el Capltulo 4. 
b iCual es P(l < E t <2.5)? L P( 1 < E, < 2.5)? 

c ^Para que valores de y 2 esta definida la densidad condicional/0 , 1 |y 2 )? 
d Para cualquier y 2 > 0, ^.cual es la funcion de densidad condicional de Ej dado que E 2 = y 2 ? 
e Para cualquier Vj > 0, ^.cual es la funcion de densidad condicional de Ej dado que E t = y{! 
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f Para cualquier y 2 > 0, ^como se compara la funcion de densidad condicional/(y^y,,) q ue obtuvo en 
el inciso d con la funcion de densidad marginal f^y^) hallada en el inciso a? 
g ^Que implica su respuesta al inciso f acerca de las probabilidades marginales y condicionales de que 
Y 1 caiga en cualquier intervalo? 

5.26 En el Ejercicio 5.8 dedujimos el hecho de que 

{ 4yiy 2 , 0 £ yi < 1, 0 s 3*2 — 1, 

0, en cualquier otro punto 


es una funcion de densidad de probabilidad conjunta. Encuentre 

a las funciones de densidad marginal para Y { y Y 2 . 
b P(Y t < l/2|F 2 >3/4). 

c la funcion de densidad condicional de Y l dado que Y 2 = v 2 . 
d la funcion de densidad condicional de F 2 dado que Y 1 = 
e P(Y 1 < 3/4|F 2 = 1/2). 

5.27 En el Ejercicio 5.9 determinamos que 

f 6(1 ~y 2 ), 0 <y! <y 2 < 1, 

f(y u yi) = 

10, en cualquier otro punto 


es una funcion de densidad de probabilidad conjunta valida. Encuentre 
a las funciones de densidad marginal para Y\ y Y 2 . 
b P(F,< 1/2^ < 3/4). 

c la funcion de densidad condicional de Fj dado que Y 2 = y 2 . 
d la funcion de densidad condicional de F 2 dado que Y 1 = y,. 
e P(Y 2 > 3/4|Fj = 1/2). 

5.28 En el Ejercicio 5.10 demostramos que 


f(y 1 , yi) 


1, 0 £ yi £ 2, 0 £ y 2 £ 1, 2y 2 •— y lt 

0, en cualquier otro punto 


es una funcion de densidad de probabilidad conjunta valida para Pj, la cantidad de contaminante por 
muestra recolectada arriba de la chimenea que no tenia el aparato limpiador, y para Y 2 , la cantidad reco- 
lectada arriba de la chimenea con el aparato limpiador. 

a Si consideramos la chimenea con el limpiador instalado, encuentre la probabilidad de que la cantidad 
de contaminante en una muestra determinada sea mayor que .5. 
b Dado que se observa que la cantidad de contaminante en una muestra tomada arriba de la chimenea 
con el limpiador es 0.5, encuentre la probabilidad de que la cantidad de contaminante exceda de 1.5 
arriba de la otra chimenea (la que no tiene limpiador). 

5.29 Consulte el Ejercicio 5.11. Encuentre 

a las funciones de densidad marginal para Y l y Y 2 . 
b P(Y 2 > l/2|Fj = 1/4). 

5.30 En el Ejercicio 5.12 nos dieron la siguiente funcion de densidad de probabilidad conjunta para las varia¬ 
bles aleatorias Y 1 y Y 2 , que fueron las proporciones de dos componentes en una muestra tomada de una 
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mezcla de insecticida: 

[2, 0 £ yi £ 1, 0 £ y 2 — 1. 0 £ yi + y 2 — 1- 

f(y uyi) = | , 

I 0, en cualquier otro punto. 

a Encuentre P(Y ] > I /2|E 2 < I /A). 
b Encuentre P(Y i > 1/2|E 2 = 1/4). 

5.31 En el Ejercicio 5.13 la funcion de densidad conjunta de Ej y Y 2 esta dada por 

,, , [ 30y!y|, yi - 1 < y 2 < 1 -yi,0 < yi < 1, 

f(yu yi) = \ 

l 0, en cualquier otro punto. 

a Demuestre que la densidad marginal de E t es una densidad beta con a = 2 y /3 = 4. 
b Obtenga la densidad marginal de E 2 . 
c Obtenga la densidad condicional de E 2 dado que E, = y v 
d Encuenb'e P( E 2 > 0|Ej = .75). 

5.32 Suponga que las variables aleatorias Y l y E 2 tienen funcion de densidad de probabilidad conjunta, f(y 1 , 
y 2 ), dada por (vea el Ejercicio 5.14) 

, f 6yjy 2 , 0 < yj < y 2 , yi + y 2 £ 2, 

f(yu y 2 ) = \ 

[ 0, en cualquier otro punto. 

a Demuestre que la densidad marginal de E t es una densidad beta con a = 3 y fi = 2. 
b Deduzca la densidad marginal de E 2 . 
c Deduzca la densidad condicional de E 2 dado que E t = y,. 
d Encuenb'e P(Y 2 < 1. 11E, = .60). 

5.33 Suponga que Ej es el tiempo total entre la llegada de un cliente a la tienda y su salida desde la ventanilla 
de servicio. E, es el tiempo empleado en la lila de espera antes de llegar a la ventanilla y la densidad 
conjunta de estas variables (como se da en el Ejercicio 5.15) es 

f e~ yi , 0 < y 2 < yj < cx3, 

f(y 1.E2) = { 

I 0, en cualquier otro punto. 
a Encuentre las funciones de densidad marginal para Y l y E,. 

b ^Cual es la funcion de densidad condicional de Y l dado que E 2 = y 2 ? Asegurese de especificar los 
valores de y 2 para los cuales esta definida esta densidad condicional. 
c ^Cual es la funcion de densidad condicional de E 2 dado que Ej = yj? Asegurese de especificar los 
valores de y, para los cuales esta definida esta densidad condicional. 
d ^,La funcion de densidad condicional/(y/v,) que obtuvo en el inciso b es la misma que la funcion de 
densidad marginal,/jfyj) hallada en el inciso a? 

e iQue implica su respuesta al inciso d acerca de las probabilidades marginal y condicional de que Ej 
caiga en cualquier intervalo? 

5.34 Si Ej esta uniformemente distribuida en el intervalo (0, 1) y, para 0 < yj < 1, 

[ 1/yi, 0<y 2 <yi, 

/(E2|yi) = | 

I 0, en cualquier otro punto. 

a ^Cual es el “nombre” de la distribucion condicional de E, dado que Ej = y{! 
b Encuentre la funcion de densidad conjunta de Ej y E 2 . 
c Encuentre la funcion de densidad marginal para E 2 . 
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5.35 Consulte el Ejercicio 5.33. Si transcurren dos minutos entre la llegada de un cliente a una tienda y su 
salida de la ventanilla de servicio, encuentre la probabilidad de que espere en la fila menos de un minuto 
para llegar a la ventanilla. 

5.36 En el Ejercicio 5.16, bj y F 2 denotaron las proporciones de tiempo durante las cuales los empleados I y 
II en realidad ejecutaron sus tareas asignadas durante un dfa de trabajo. La densidad conjunta de Ij y Y 2 
esta dada por 

[ yi + yi, 0 £ yi £ 1, 0 £ y 2 — L 

/Cyi.yz) = | 

I 0, en cualquter otro punto. 

a Encuentre las funciones de densidad marginales para F t y Y 2 . 
b Encuentre P(Y 1 > 1/2|F 2 > 1/2). 

c Si el empleado II pasa exactamente 50% del dfa trabajando en sus tareas asignadas, encuentre la 
probabilidad de que el empleado I pase mas de 75% del dfa trabajando en tareas similares. 

5.37 En el Ejercicio 5.18, Y l y Y 2 denotaron el tiempo de vida util, en cientos de horas, para componentes de 
los tipos I y II, respectivamente, en un sistema electronico. La densidad conjunta de Y 1 y Y 2 esta dada 
por 

( (l/8)y 1 e" (3 ' 1+w >/ 2 , yi >0, y 2 >0, 

f(y uyi) = { 

[ 0, en cualquier otro punto. 

Encuentre la probabilidad de que el componente tipo II tenga una vida util de mas de 200 horas. 

5.38 Denote con bj el peso (en toneladas) de un artlculo a granel que un proveedor tiene en existencia al 
principio de una semana y suponga que Ij tiene una distribucion uniforme en el intervalo 0 £ y 1 £ 1. 
Denote con Y 2 la cantidad (en peso) de este artlculo vendido por el proveedor durante la semana y suponga 
que Y 2 tiene una distribucion uniforme en el intervalo 0 £ y 2 — Vi, donde y, es un valor especffico de Y v 

a Encuentre la funcion de densidad conjunta para Fj y Y 2 . 

b Si el proveedor tiene en existencia media tonelada del artlculo, ^,cual es la probabilidad de que venda 
mas de un cuarto de tonelada? 

c Si se sabe que el proveedor vendio un cuarto de tonelada del artlculo, ^cual es la probabilidad de que 
hubiera tenido en existencia mas de media tonelada? 

*5.39 Suponga que 1/ y Y 2 son variables aleatorias independientes con distribucion de Poisson, con medias Aj 
y A 2 , respectivamente. Sea W = Y 1 + Y 2 . En el Capftulo 6 demostraremos que W tiene una distribucion 
de Poisson con media Aj + A 2 . Use este resultado para demostrar que la distribucion condicional de Fj, 
dado que W = w, es una distribucion binomial con n = wy p = Aj/(Aj + A,). 1 

* 5.40 Suponga que Y l y F, son variables aleatorias independientes con distribucion binomial basadas en mues- 
tras de tamanos n 1 y n 2 , respectivamente. Suponga que p x = p 2 = p. Esto es, la probabilidad de “exito” es 
la misma para las dos variables aleatorias. Sea W = Y l + Y 2 . En el Capftulo 6 demostraremos que W tiene 
una distribucion binomial con probabilidad de exito p y tamano muestral n l + n 2 . Use este resultado 
para demostrar que la distribucion condicional de Fj, dado que W = w, es una distribucion hipergeome- 
trica con N = n t + n 2 , n — w y r = n v 

*5.41 Un plan de control de calidad exige seleccionar aleatoriamente tres artfculos provenientes de la produc¬ 
tion diaria (supuestamente grande) de cierta maquina y observar el numero de artfculos defectuosos. No 
obstante, la proportion p de artfculos defectuosos producidos por la maquina varfa de un dfa a otro y se 
supone que tiene una distribucion uniforme en el intervalo (0, 1). Para un dfa escogido aleatoriamente, 
encuentre la probabilidad incondicional de que se observen exactamente dos artfculos defectuosos en la 
muestra. 


1. Los ejercicios precedidos por un asterisco son opcionales. 
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*5.42 Se sabe que el numero de defectos por yarda Y para cierta tela tiene una distribucion de Poisson, con para- 
metro A. No obstante, A es una variable aleatoria con funcion de densidad de probabilidad dada por 

[e~\ A>0, 

/(A) = 

[ 0, en cualquier otro punto. 

Encuentre la funcion de probabilidad incondicional para Y. 


5.4 Variables aleatorias independientes 

En el Ejemplo 5.8 vimos dos variables aleatorias dependientes, para las cuales las probabili- 
dades asociadas con Y l dependfan del valor observado de Y 2 . En el Ejercicio 5.24 (y algunos 
otros) este no fue el caso: las probabilidades asociadas con K 1 eran iguales, cualquiera que 
fuera el valor observado de Y 2 . Ahora presentamos una definicion formal de independencia de 
variables aleatorias. 

Dos eventos A y B son independientes si P(A n B) = P(A) x P(B). Cuando estudiemos 
variables aleatorias, sia<byc<des frecuente que nos interesemos en eventos del tipo (a < 
Fj < b) n (c < Y 2 < d). Por consistencia con la definicion anterior de eventos independientes, 
si Ej y Y 2 son independientes, nos gustarfa tener 

P(a <Yi<b, c < Y 2 < d) = P(a < Y x < b) X P(c < Y 2 < d) 

para cualquier eleccion de numeros reales a < b y c < d. Esto es, si K, y Y 2 son indepen¬ 
dientes, la probabilidad conjunta se puede escribir como el producto de las probabilidades 
marginales. Esta propiedad se satisface si Y 1 y Y 2 son independientes en el sentido detallado 
en la siguiente definicion. 

DEFINICION 5.8 Sea Y l que tiene una funcion de distribucion /’’, (y 1 ) y sea Y 2 que tiene una funcion de dis¬ 
tribucion F 2 (y 2 ), y P(y ,, >’ 2 ) es la funcion de distribucion conjunta de Ej y Y 2 . Entonces 
se dice que K, y Y 2 son independientes si y solo si 

F(yu yi) = F l (yi)F 2 (y 2 ) 

para todo par de numeros reales (y 1; y 0 ). 

Si fj y Y 2 no son independientes, se dice que son dependientes. 

Por lo general es comodo establecer la presencia o ausencia de independencia, por medio 
del resultado del siguiente teorema. Se omite la demostracion; vea “Bibliograffa y lecturas 
adicionales” al final del capftulo. 

TEOREMA 5.4 Si Ej y Y 2 son variables aleatorias discretas con funcion de probabilidad conjunta p(y v 
y 2 ) y funciones de probabilidad marginal p , (y,) y p 2 (y 2 ), respectivamente, entonces Ej y 
Y 2 son independientes si y solo si 

p(y t, yi) = pi(yi)pi(y2) 

para todos los pares de numeros reales (jq, y 2 ). 
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Si K, y Y 2 son variables aleatorias continuas con funcion de densidad conjunta/^j, y 2 ) 
y funciones de densidad marginal ffyy) y/ 2 (y 2 ), respectivamente, entonces K, y K 2 son 
independientes si y solo si 

fiyu yi) = f\iy\)hiyi) 

para todos los pares de numeros reales (y,, y 2 ). 


A continuation ilustramos el concepto de independencia con algunos ejemplos. 


EJEMPLO 5.9 Para el problema de tirar un dado de la Section 5.2, demuestre que Y x y Y 2 son independien¬ 
tes. 

Solucion En este problema a cada uno de los 36 puntos muestrales se le dio probabilidad 1/36. 

Considere, por ejemplo, el punto (1, 2). Sabemos que p( 1, 2) = 1/36. Tambien, p x {\) = P(Y X 
= 1) = 1/6 y p 2 {2 ) = P(Y 2 = 2) = 1/6. Por tanto, 

Pi 1, 2)= Pl (l)p 2 (2). 

Lo mismo es cierto para todos los demas valores de y, y y 2 , de lo cual se deduce que Y x y Y 2 
son independientes. ■ 


EJEMPLO 5.10 Consulte el Ejemplo 5.5. g,EI numero de republicanos en la muestra es independiente del nu- 
mero de democratas? ( ( ',Es Y x independiente de K 2 ?) 

Solucion La independencia de variables aleatorias discretas requiere que p(y t , y 2 ) = p/v,) pdyy) para 
toda seleccion (y ,, y 2 ). Entonces, si esta igualdad es violada para cualquier par de valores 
(jj, y 2 ), las variables aleatorias son dependientes. A1 observar la esquina superior izquierda de 
la Tabla 5.2, veremos que 


P( 0, 0) = 0. 

Pero pj(0) = 3/15 y p 2 {0) = 6/15. En consecuencia. 

Pi 0, 0) A Pj(0)p 2 (0), 

de modo que Y [ y Y 2 son dependientes. ■ 


EJEMPLO 5.11 Sea 


fiyu yi) 


6y\yl, 

0 , 


Demuestre que K, y Y 2 son independientes. 


0 < yi < 1, 0 < y 2 ' 1, 

en cualquier otro punto. 
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Solucion Tenemos 


Myi) = 


r [ l 7 ( y 3 

J f(y i. yi) dy 2 = J I 6yiy\ dy 2 = 6yi I y 


= 2y u 


f 


f(y\,yi)dy 2 = 0d yi =0 


f 


0 < yi < 1, 
en cualquier otro punto. 


Del mismo modo, 


hiyi) = 


En consecuencia, 


/ OO 

f(yu yi) dy\ = / 6viy| dy t = 3 yj, 0 < y 2 < 1, 

-oo 


f 


£ 

f. 


f{y\,yi)dy l = 0dv 1 = 0, en cualquier otro punto. 


f(yi, y 2) = fi(yi)f2(y2 ) 

para todos los numeros reales (v j, V 2 ) V, por tanto, Y ] y Y 2 son independientes. 


EJEMPLO 5.12 Sea 


f(yu yi) 


2, 0 < y 2 S yi < 1, 

0, en cualquier otro punto. 


Demuestre que K, y Y 2 son dependientes. 

Solucion Vemos que /ivj, y 2 ) = 2 sobre la region sombreada que se ve en la Figura 5.7. Por tanto, 


Myi) 





= 2yi, 


0 < yi < 1, 

en cualquier otro punto. 
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Del mismo modo, 


h(yi) 


Por tanto, 



0 , 



2(1- y 2 ), 0<j 2 <1, 

en cualquier otro punto. 


f(yu yi) f Mytifiiyi) 

para algun par de numeros reales ( v ,, y 2 ) y, por tanto, Tj y Y 2 son dependientes. ■ 


Observara una diferencia distinta en los limites de integracion empleados para hallar las 
funciones de densidad marginal obtenidas en los Ejemplos 5.11 y 5.12. Los limites de integra¬ 
cion para y 2 , comprendidos en hallar la densidad marginal de Tj en el Ejemplo 5.12, dependian 
de y v En contraste, los limites de integracion fueron constantes cuando determinamos las 
funciones de densidad marginal del Ejemplo 5.11. Si los limites de integracion son constan¬ 
tes, el siguiente teorema proporciona una forma facil de demostrar la independencia de dos 
variables aleatorias. 


TEOREMA 5.5 Sean Tj y Y 2 que tienen una densidad conjunta/tjj, y 2 ) que es positiva si y solo si a < 
< b y c < y 2 < d, para constantes a, b, c y d\ yf(y v y 2 ) = 0 en otro caso. Entonces 
Y { y Y 2 son variables aleatorias independientes si y solo si 

/CV1O2) = ^Cvi)^Cy 2 ) 

donde gtjj) es una funcion no negativa de y j solamente y h(y 2 ) es una funcion no nega- 
tiva de vy solamente. 


La demostracion de este teorema se omite. (Vea “Bibliografia y lecturas adicionales” al 
final del capitulo.) El beneficio clave del resultado dado en el Teorema 5.5 es que en realidad 
no necesitamos obtener las densidades marginales. De hecho, las funciones y h(y 2 ) no 
necesitan ser funciones de densidad (aun cuando sean multiplos constantes de las densidades 
marginales, deberfamos tomarnos la molestia de determinar estas). 


EJEMPLO 5.13 Sean fj y Y 2 que tienen una densidad conjunta dada por 

/(«,») = (^‘- °*», s ‘• os » s i’ 

[ 0, en cualquier otro punto. 
lY l y Y 2 son variables independientes? 

Solucion Observe que/lyj, vy) es positiva si y solo si 0 < y, < I y 0 < >y < 1. Ademas, f(y v y 2 ) = g(y,) /;(>y), 

donde 

f y u 0 < yi < 1, 

g(yt) = n . y Kyi) = 

[ 0, en cualquier otro punto, 


2, 0 s y2 — 1. 

0, en cualquier otro punto. 
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Por tanto, F : y F, son variables aleatorias independientes. Observe que g(y t ) y h(y 2 ), como 
aquf se definen, no son funciones de densidad, aun cuando 2g(y l ) y h(y 2 )/2 sean densidades. 


EJEMPLO 5.14 Consulte el Ejemplo 5.4. lj. la cantidad en existencia, es independiente de Y 2 , la cantidad 
vendida? 

Solucion Como la funcion de densidad es positiva si y solo si 0 < y 2 < y ; < 1, no existen constantes 
a, b, cy d tales que la densidad sea positiva en la region a < ^ < fc, c s y 2 s rf. Entonces, el 
Teorema 5.5 no se puede aplicar. No obstante, se puede demostrar que Fj y F 2 son variables 
aleatorias dependientes porque la densidad conjunta no es el producto de las densidades mar- 
ginales. ■ 


Las definiciones 5.8 facilmente se pueden generalizar a n dimensiones. Suponga que tene- 
mos n variables aleatorias, F h . . . , Y n , donde Y t tiene funcion de distribucion F ; (y ; ), para i = 
1,2, ..., n; y donde F h F 2 ,. . ., Y n tienen funcion de distribucion conjunta F(y ,, y 2 , . .., yj. 
Entonces Fj, F 2 ,. . ., Y n son independientes si y solo si 

F(y t, yi, ■ ■ ■, y „) = Ci(yi) ■ • • F„(y n ) 

para todos los numeros reales y u y 2 ,, y n , con las formas equivalentes obvias para los casos 
discretos y continuos. 

Ejercicios 

5.43 Sean Fj y F 2 que tienen una funcion de densidad conjunta/Cyj, y 2 ) y densidades marginales/jfVj) y/ 2 (y 2 ). 
respectivamente. Demuestre que Fj y F 2 son independientes si y solo si/tjqly^) = f\ (y,) para todos los 
valores de y, y para toda y 2 tal que / 2 (y 2 ) > 0. Un argumento completamente analogo establece que Fj 
y F 2 son independientes si y solo si/(y 2 |yj) = / 2 (y 2 ) para todos los valores de y, y para toda -yq tal que 
/:(>•,) >0. 

5.44 Demuestre que los resultados del Ejercicio 5.43 tambien se cumplen para variables aleatorias discre- 
tas. 

5.45 En el Ejercicio 5.1 determinamos que la distribucion conjunta de Fj, el numero de contratos concedidos 
a la empresa A, y F 2 , el numero de contratos concedidos a la empresa B, esta dada por las entradas de la 
tabla siguiente. 


y2 


yi 


0 

l 

2 

0 

1/9 

2/9 

1/9 

i 

2/9 

2/9 

0 

2 

1/9 

0 

0 


La funcion de probabilidad marginal de F( se determino en el Ejercicio 5.19 como binomial con n = 2 
y p = 1/3. ^Fj y F 2 son independientes? ^Por que? 
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5.46 Consulte el Ejercicio 5.2. El numero de caras en tres tiros de moneda esta binomialmente distribuido con 
n = 3,p = 1 /2. ^Son independientes el numero total de caras y sus ganancias en la apuesta colateral? 
[Examine su respuesta al Ejercicio 5.20(b).] 

5.47 En el Ejercicio 5.3 determinamos que la distribucion de probabilidad conjunta de Pj, el numero de eje- 
cutivos casados y Y 2 , el numero de ejecutivos que no se han casado, esta dada por 


p(yu yi) 



donde y, y y 2 son enteros, 0 S ^ < 3, 0 S y 2 < 3 y 1 £ + y 2 £ 3. iY 1 y Y 2 son independientes? 

(Recuerde su respuesta al Ejercicio 5.21.) 

5.48 En el Ejercicio 5.4 se determino la siguiente funcion de probabilidad conjunta para 


Yi 


0, si el nino sobrevive, 
1, si no sobrevive, 


0, si no usaba cinturon, 

1, si usaba cinturon para adulto, 

2, si usaba el cinturon del asiento del auto. 


72 

yi 

0 

1 

Total 

0 

.38 

.17 

.55 

1 

.14 

.02 

.16 

2 

.24 

.05 

.29 

Total 

.76 

.24 

1.00 


l > Y l y Y 2 son independientes? ^Por que si o por que no? 

5.49 En el Ejemplo 5.4 y en el Ejercicio 5.5 consideramos la densidad conjunta de Y v la proporcion de la 
capacidad del tanque que ha sido abastecido al principio de la semana y Y 2 , la proporcion de la capacidad 
vendida durante la semana, dadas por 

f 3yi, 0 < y 2 £ >’i =£ 1, 

f(y u yi) = | 

I 0, en cualquier otro punto. 

Demuestre que Pj y Y 2 son dependientes. 

5.50 En el Ejercicio 5.6 supusimos que si una particula radiactiva se coloca en un cuadrado con lados de 
longitud unitaria, un modelo razonable para la funcion de densidad conjunta para Pj y Y 2 es 

f 1, 0 < yi < 1, 0 < y 2 ^ 1, 

ftyuyi) = 

I 0, en cualquier otro punto. 

a iY x y Yj son independientes? 

b ^,E1 resultado del inciso a explica los resultados obtenidos en el Ejercicio 5.24 d - f? ^Por que? 

5.51 En el Ejercicio 5.7 consideramos Pj y Y 2 con funcion de densidad conjunta 

[ e ~(yi+yi)' y!>0, y 2 > 0, 

[ 0, en cualquier otro punto. 

a iY^ y Y-, son independientes? 

b ^E1 resultado del inciso a explica los resultados obtenidos en el Ejercicio 5.25 d - f? ^Por que? 
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5.52 En el Ejercicio 5.8 dedujimos que 

{ 4yiy 2 , 0 ^ yi £ 1 , 0 £ y 2 £ 1 , 

0, en cualquier otro punto 

es una funcion de densidad de probabilidad conjunta valida. i l Y 1 y Y 2 son independientes? 

5.53 En el Ejercicio 5.9 determinamos que 

f 6(1 — y 2 ), 0 <yi <y 2 < 1, 

f(yu yi) = 

I 0, en cualquier otro punto 

es una funcion de densidad de probabilidad conjunta valida. y Y 2 son independientes? 

5.54 En el Ejercicio 5.10 demostramos que 

{ 1, 0 £ yi £ 2,0 £ y 2 £ 1, 2 y 2 — y lt 

0, en cualquier otro punto 


es una funcion de densidad de probabilidad conjunta valida para F t , la cantidad de contaminante por 
muestra recolectada arriba de la chimenea que no esta equipada con aparato limpiador, y F 2 , la cantidad 
recolectada arriba de la chimenea con limpiador. ^Son independientes las cantidades de contaminantes 
por muestra recolectadas con y sin el aparato limpiador? 

5.55 Suponga que, como en el Ejercicio 5.11, Fj y F 2 estan uniformemente distribuidas sobre el triangulo 
sombreado en el diagrama adjunto. lY 1 y Y 2 son independientes? 

5.56 En el Ejercicio 5.12 se determino la siguiente funcion de densidad de probabilidad conjunta para las va¬ 
riables aleatorias Fj y F 2 , que eran las proporciones de dos componentes en una muestra de una mezcla 
de insecticida: 


0 £ yi < 1,0 £ y 2 — 1,0 £ yi + y 2 < 1, 

en cualquier otro punto. 

lY i y F, son independientes? 

5.57 En los Ejercicios 5.13 y 5.31, la funcion de densidad conjunta de Fj y F 2 fue dada por 


f(yu yi) = 


f(yu yi) 


f 30yiy|, y, - 1 < y 2 < 1 - y!, 0 < yi < 1, 

I 0, en cualquier otro punto. 


^Las variables aleatorias F t y F 2 son independientes? 

5.58 Suponga que las variables aleatorias Y 1 y F 2 tienen funcion de densidad de probabilidad conjunta,/(Vj, 
V 2 ), dada por (vea Ejercicios 5.14 y 5.32) 


f(yuyi) = 


6y? yi, 0 < yi < y 2 , yj + y 2 < 2, 

0, en cualquier otro punto. 


Demuestre que Fj y F, son variables aleatorias dependientes. 

5.59 Si Fj es el tiempo total entre la llegada de un cliente a una tienda y su salida de la ventanilla de servicio, 
y si F 2 es el tiempo empleado en la fila de espera antes de llegar a la ventanilla, la densidad conjunta de 
estas variables, de acuerdo con el Ejercicio 5.15, es 

f(yu yi ) = 



lY i y Y 2 son independientes? 


0, 


0 < y 2 < yi <oo 

en cualquier otro punto. 
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5.60 En el Ejercicio 5.16, Y l y Y-, denotaron las proporciones de tiempo que los empleados I y II pasaron 
realmente trabajando en sus tareas asignadas durante un dla habil. La densidad conjunta de Y 1 y Y 2 esta 
dada por 

\yi+y 2 , 0<yi<l,0<y 2 <l, 
f(y i.y 2 ) = | 

I 0, en cualquier otro punto. 

lYiY Y 2 son independientes? 

5.61 En el Ejercicio 5.18, Y l y Y 2 denotaron las duraciones de vida util, en cientos de horas, para componentes 
de los tipos I y II, respectivamente, en un sistema electronico. La densidad conjunta de Y x y Y 2 es 

((l/8)yie“ ( « + ^ 2 , yi >0,y 2 > 0, 
f(.y i, y 2 ) = { 

( 0, en cualquier otro punto. 

lY l y Y 2 son independientes? 

5.62 Suponga que la probabilidad de que aparezca una cara cuando una moneda se lanza al aire es p y que 
la probabilidad de que aparezca una cruz es q = 1 - p. La persona A lanza la moneda hasta que aparece la 
primera cara y se detiene. La persona B hace lo mismo. Los resultados obtenidos por las personas A y B se 
supone que son independientes. ^,Cual es la probabilidad de que A y B se detengan en exactamente el mismo 
numero de tiros? 

5.63 Sean Fj y Y 2 variables aleatorias independientes distribuidas exponencialmente, cada una con media 1. 
Encuentre P(F, > F 2 | F, < 2F 2 ). 

5.64 Sean Y t y Y 2 variables aleatorias independientes que estan distribuidas uniformemente en el intervalo 
(0, 1). Encuentre P(Y 1 < 2F 2 |F, < 3 Y 2 ). 

*5.65 Suponga que, para -1 < a £ 1, la funcion de densidad de probabilidad de (Fj, Y 2 ) esta dada por 

f [1 — «{(1 — 2e _vi )(l - 2 e-»)}] e -w-», 0 <y 1; 0 < y 2 , 
f(y i.F 2 ) = | 

I 0, en cualquier otro punto. 

a Demuestre que la distribucion marginal de Y l es exponencial con media 1. 
b ^Cual es la distribucion marginal de F 2 ? 
c Demuestre que Fj y F 2 son independientes si y solo si a = 0. 

Observe que estos resultados implican que hay un numero infinito de densidades conjuntas tales que 
ambas densidades marginales son exponenciales con media 1. 

*5.66 Sean FjCyj) y F-,(y 2 ) dos funciones de distribucion. Para cualquier a,- 1Sh<1, considere Fj y F 2 con 
funcion de distribucion conjunta 

F(y u y 2 ) = EHyOFzte)[1 - «{1 - FjjyOHl - F 2 (y 2 )}]. 

a ^Cual es F(y l , oo), la funcion de distribucion marginal de Y{! [Sugerencia: ^cual es F,(oo)?] 
b ^Cual es la funcion de distribucion marginal de F 2 ? 
c Si a = 0 ^por que son independientes Fj y F 2 ? 
d i,F[ y F 2 son independientes si a A 0? ^Por que? 

Observe que esta construction se puede usar para producir un numero infinito de funciones de distribu¬ 
cion conjunta que tengan las mismas funciones de distribucion marginal. 

5.67 En la Section 5.2 dijimos que si F t y F 2 tienen una funcion de distribucion acumulativa conjunta 
F(y 1; y 2 ), entonces para cualquier a < by c < d 


P{a <Yi <b,c <Y 2 <d) = F(b, d) - F(b, c ) - F(a, d) + F(a, c). 
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Si F t y F, son independientes, demuestre que 


P(a <Yi <b,c <Y 2 < d) = P{a <Y { <b)X P(c < F 2 < d). 


[Sugerencia: exprese P{a < Fj £ b) en terminos de Fj(-).] 

5.68 Un supermercado tiene dos clientes esperando para pagar sus compras en la caja I y un cliente esperando 
pagar en la caja II. Denote con Y l y F, los numeros de clientes que gastan mas de $50 en abarrotes en las 
cajas respectivas. Suponga que Fj y F, son variables aleatorias binomiales independientes, la probabili- 
dad de que un cliente en la caja I gaste mas de $50 es .2 y la probabilidad de que un cliente en la caja II 
gaste mas de $50 es igual a .3. Encuentre 

a la distribucion de probabilidad conjunta para Fj y F 2 . 
b la probabilidad de que no mas de uno de los tres clientes gaste mas de $50. 

5.69 La vida util F para cierto tipo de fusibles esta modelada por la distribucion exponencial, con 

f (l/3)e“^ /3 , y > 0, 

f(y ) = 

[ 0, en cualquier otro punto. 

(Las mediciones son en cientos de horas.) 

a Si dos de esos fusibles tienen vidas utiles independientes Fj y F 2 , encuentre la funcion de densidad 
de probabilidad conjunta para Y 1 y F 2 . 

b Un fusible en el inciso a esta en un sistema primario y el otro esta en el sistema de respaldo que entra 
en uso solo si falla el sistema primario. La vida util efectiva total de los dos fusibles es entonces Fj 
+ F 2 . Encuentre P(Y l + F 2 < 1). 

5.70 Un autobus llega a una parada en un tiempo uniformemente distribuido en el intervalo 0 a 1 hora. Un 
pasajero tambien llega a la parada en un tiempo uniformemente distribuido en el intervalo de 0 a 1 hora. 
Suponga que los tiempos de llegada del autobus y el pasajero son independientes entre si y que el pasa¬ 
jero va a esperar hasta 1/4 de hora a que llegue el autobus. ^Cual es la probabilidad de que el pasajero 
aborde el autobus? [Sugerencia: denote con Fj la hora de llegada del autobus y con F 2 la hora de llegada 
del pasajero; determine la densidad conjunta de Fj y F, y encuentre P{Y 2 £ Fj £ F 2 + 1/4).] 

5.71 Dos llamadas telefonicas entran en un conmutador en tiempos aleatorios en un periodo fijo de una hora. 
Suponga que las llamadas se hacen independientemente una de la otra. ^,Cual es la probabilidad de que 
las llamadas se hagan 

a en la primera media hora?, 
b a no mas de cinco minutos entre si? 


5.5 El valor esperado de una funcion 
de variables aleatorias 

Para justificar la siguiente definition solo se necesita construir el equivalente multivariante 
del caso univariante. 
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DEFINICION 5.9 Sea g(Y { , Y 2 , . . . , Y k ) una funcion de las variables aleatorias discretas, fj, Y 2 , . . ., Y k , 
que tienen funcion de probabilidad p(y { , y 2 , . . . , y k )- Entonces el valor esperado de 
g{Y v Y 2 ,...,Y k )e s 

E[g{Y\, Y 2 ,..Y k )] = E-EE g{y\,yi,---, yk)p(yi,y2,---, yk )■ 

toda yk toda_y 2 toda vi 

Si fj, Y 2 , . . . , Y k son variables aleatorias continuas con funcion de densidad conjunta 
/On y 2 > ■ ■ • > Yk)’ entonces 2 

/ oo /*oo /*oo 

/ / g(yuy 2 ,---, yk) 

-oo J — oo J —oo 

Xf(yi,y 2 , ■■■, yk) dy x dy 2 ... dy k . 


EJEMPLO 5.15 


Considere que Y t y Y 2 tienen una densidad conjunta dada por 


f(yu y2) 


J 2yi, 0 < yi < 1, 0 < y 2 =£ 1, 

[ 0, en cualquier otro punto. 


Encuentre E(Y l Y 1 ). 


Solucion De la Definicion 5.9 obtenemos 


E{Y,Y 2 ) 



ymfiyi, y 2 )dy x dy 2 



yiyi(2y l )dy l dy 2 



Demostraremos que la Definicion 5.9 es consistente con la Definicion 4.5, en la que definimos 
el valor esperado de una variable aleatoria univariante. Considere dos variables aleatorias K, y 
Y 2 con funcion de densidad /On V 2 )- Deseamos hallar el valor esperado de g(fj, Y 2 ) = Y v 
De la Definicion 5.9 tenemos 


/ OO /*00 

/ Yi f (Oi > Yi) dy 2 dy 

-oo J—oo 


/ 'oo r r o 

yi \ 

-oo \_J — c 


/Cyi> >0 /y 2 


(/Vj. 


La cantidad dentro de parentesis rectangulares, por definicion, es la funcion de densidad mar¬ 
ginal para Y v Por tanto, obtenemos 

/ OO 

yiMyi)dy u 

-00 

que esta acorde con la Definicion 4.5. 


2. De nuevo, decimos que existen valores esperados si E ' " E l£(yi» yi, • • • » yn)\p(yu yi, • • • > yk) 
/ ■ • • / |g(;yi> y 2 , • • •, y n )\f(yi, yi,---, yk) dy x ... dy k es finita. 


o si 
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EJEMPLO 5.16 Considere que Y x y Y 2 que tienen una densidad conjunta dada por 


f(yu yi) = 

Encuentre el valor esperado de Y v 


Solucion 


£(Fi) = 


L 


2yi, 0 < yi < 1, 0 < y 2 — 1, 
0, en cualquier otro punto. 




y l (2y l )dy 1 dy 2 


1 /o 3 -| 1 

/ 2 y{ 1 


f 


%1 2 2 " 

dy 2 = I ~dy 2 = -y 2 


2 

3' 


Consulte la Figura 5.6 y calcule el valor esperado de Y v El valor E{Y X ) = 2/3 parece ser bas- 
tante razonable. ■ 


EJEMPLO 5.17 


En la Figura 5.6 el valor medio de Y 2 parece ser igual a .5. Confirmemos este calculo visual. 
Encuentre E(Y 2 ). 


Solucion 



EJEMPLO 5.18 Sean Y t y Y 2 variables aleatorias con funcion de densidad 

0<yi < l,0<y 2 < 1, 

en cualquier otro punto. 

Encuentre EJEj). 

Solucion La densidad marginal para K, obtenida en el Ejemplo 5.6 es 

/.<»> = (?’" 0sy \ sh 

[ 0, en cualquier otro punto. 

Entonces V(Y l ) = E(Yf) - [£(Li)] 2 , y 

2 

k + 2 


/ OO r 1 

y k \h(y\)dy x = / y\(2yi)dyi 

-oo J 0 


2y 


,k+2 


y i 


k + 2 


f(yu yi) = 


2yi, 

0, 


0 
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Si hacemos k = I y k = 2, se deduce que E( Y ] ) y E (F 2 ) son 2/3 y 1 /2, respectivamente. 
Entonces E(iT) = E(Y\) - [£(fT)] 2 = 1/2 - (2/3) 2 = 1/18. ■ 


EJEMPLO 5.19 Del proceso para producir una sustancia quimica industrial se obtiene un producto que contiene 
dos tipos de impurezas. Para una muestra especffica proveniente de este proceso, denotemos con 
Y ] la proporcion de impurezas en la muestra y con Y 2 la proporcion de impurezas tipo I entre to- 
das las impurezas halladas. Suponga que la distribucion conjunta de Y ] y Y 2 puede ser modelada 
con la siguiente funcion de densidad de probabilidad: 

,, x J 2(1 — yi), 0 < yi < 1, 0 <y 2 =£ 1, 

f(y i.ys) = - 

0, en cualquier otro punto. 

Encuentre el valor esperado de la proporcion de impurezas tipo I de la muestra. 


Solucion 


Como Y x es la proporcion de impurezas en la muestra y Y 2 es la proporcion de impurezas tipo 
I entre las impurezas muestrales, se deduce que Y{Y 2 es la proporcion de impurezas tipo I en 
toda la muestra. Entonces, buscamos hallar E( K, K 2 ): 


E(Y x Y 2 ) 



2yiV2(l - yi)dy 2 dy l 



vi(l - yi) 




dy x 


Por tanto, esperarfamos que 1/6 de la muestra estuviera formado por impurezas tipo I. ■ 


5.6 Teoremas especiales 

Los teoremas que facilitan el calculo del valor esperado de una constante, el valor esperado 
de una constante por una funcion de variables aleatorias y el valor esperado de la suma de 
funciones de variables aleatorias son semejantes a los del caso univariante. 

TEOREMA 5.6 Sea c una constante. Entonces 

E(c) = c. 

TEOREMA 5.7 Sea g(Y v Y 2 ) una funcion de las variables aleatorias K, y Y 2 y sea c una constante. 
Entonces 

E[cg(Y u Y 2 )]=cE[g(Y 1 ,Y 2 )]. 
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TEOREMA 5.8 


EJEMPLO 5.20 

Solucion 


TEOREMA 5.9 


Sean Y x y Y 2 variables aleatorias y g , (K,, Y 2 ), g 2 (Y v Y 2 ),. . . , g k (Y v Y 2 ) funciones de K, 
y Y 2 . Entonces 

E[gdY u Y 2 ) + g 2 (Y u Y 2 ) + ■ ■ • + g k (Y\, Y 2 )] 

= E[g\(Y\, Y 2 )] + E[g 2 (Y\, Y 2 )]+...+ E[g k {Y\, Y 2 )]. 


Las demostraciones de estos tres teoremas son analogas a los casos univariantes estudiados 
en los Capftulos 3 y 4. 


Consulte el Ejemplo 5.4. La variable aleatoria K, - Y 2 denota la cantidad proporcional de ga- 
solina remanente al final de la semana. Encuentre E(Y 1 - Y 2 ). 

Empleando el Teorema 5.8 con gi(Y lt Y 2 ) = Y l y g( K,, Y 2 ) = —Y 2 , vemos que 

E(J X - Y 2 ) = E{Y\) + E(-Y 2 ). 

Se aplica el Teorema 5.7, dando E(-Y 2 ) = -E(Y 2 ); por tanto, 


E(Y, - Y 2 ) = E(Yi) - E(Y 2 ). 


Tambien, 


E(Yi) 

E(Y 2 ) 


yi 

yi(3yi) dy 2 dy l 

yi 

y 2 Oy\) dy 2 dy l 






Entonces, 


E(Y\ — Y 2 ) = (3/4) — (3/8) = 3/8, 


de modo que esperarfamos que 3/8 del tanque este lleno al final de las ventas de la semana. 


Si las variables aleatorias motivo de estudio son independientes, en ocasiones podemos 
simplificar el trabajo necesario para hallar valores esperados. El siguiente teorema es muy util 
en este sentido. 


Sean K, y Y 2 variables aleatorias independientes y sean g(Y x ) y hiY 2 ) funciones solo de 
T, y Y 2 , respectivamente. Entonces 

E\g{Ydh{Y 2 )-\ = E[g{Yii\E[h(Y 2 )-\, 

siempre que existan los valores esperados. 
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Demostracion 


Daremos la demostracion del resultado para el caso continuo. Denotemos con f(y ,, y 2 ) 
la densidad conjunta de K, y Y 2 . El producto g(Y l )h(Y 2 ) es una funcion de Y t y Y 2 . 
Entonces, por la Definicion 5.9 y la suposicion de que K, y Y 2 son independientes, 


/ OO /»00 

/ g(yi)Kyi)f(y\, yi)dy 2 dy l 

-oo J — OO 

/ oo /»oo 

/ g(yi)Ky2)f\(yi)f2(y2)dy 2 dy l 

-oo J—oo 


r 

f 


g(.yi)/i(yi) 


f 

y —c 


Kyi) fiiyi) dy 2 


dy\ 


g(yi)Myi)E [h(Yi)]dy x 




= £ [/!(T 2 )] / g(*)/i(*) #i = e [g(Ei)] £ [A(r 2 )]. 


La demostracion para el caso discreto sigue un modo analogo. 


EJEMPLO 5.21 Consulte el Ejemplo 5.19. En ese ejemplo encontramos £( lj K 2 ) directamente. A1 investigar la 
forma de la funcion de densidad conjunta dada ahf, podemos ver que lj y Y 2 son independien¬ 
tes. Encuentre E{Y{Y 2 ) con el uso del resultado de que £( lj Y 2 ) = £( K,) £(E 2 ) si fj y K 2 son 
independientes. 

Solucion La funcion de densidad conjunta esta dada por 

f 2(1 — *), 0 ^ y\ s 1, 0 ^ y 2 < 1, 

f(yu yi) = | 

l 0, en cualquier otro punto. 


Entonces, 


Myi) 


fo 2(1 — *) dy 2 = 2(1 — *), 0 < * < 1, 

0, en cualquier otro punto, 


y 


fi(yi) 


fo 2( 1 -yi)d yi = -d -yi) 2 ]^ = 1, 0<y 2 < 1, 

0, en cualquier otro punto. 


Tenemos entonces 

E{Y X ) = jf’yi [2(1-*)]#! = 2 (f -y) 

£(E 2 ) = 1/2 


1 

3’ 


porque E 2 esta uniformemente distribuida en (0, 1). 
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Se deduce que 


E(Y,Y 2 ) = E(Y l )E(Y 2 ) = (l/3)(l/2) = 1/6, 


lo que concuerda con la respuesta del Ejemplo 


Ejercicios 

5.72 En el Ejercicio 5.1 determinamos que la distribucion conjunta de Fj, el numero de contratos concedidos 
a la Empresa A, y Y 2 , el numero de contratos concedidos a la empresa B, esta dada por las entradas de la 
tabla siguiente. 


yi 


yi 


0 

1 

2 

0 

1/9 

2/9 

1/9 

1 

2/9 

2/9 

0 

2 

1/9 

0 

0 


La funcion de probabilidad marginal de Y 1 se determino en el Ejercicio 5.19 como la binomial con n = 
2 y p = 1/3. Encuentre 

a £(Fi). 
b V{Yi). 
c E{Yi - Y 2 ). 


5.73 


En el Ejercicio 5.3 determinamos que la distribucion de probabilidad conjunta de Y v el numero de eje- 
cutivos casados y F 2 , el numero de ejecutivos que nunca se casaron, esta dada por 


p(y l, yi) 



donde y l y y 2 son enteros, 0 £ y x ^ 3, 0 ^ y 2 £ 3 y 1 £ Vj + y 2 — 3. Encuentre el numero esperado de 
ejecutivos casados de entre los tres seleccionados para promotion. (Vea el Ejercicio 5.21.) 

5.74 Consulte los Ejercicios 5.6, 5.24 y 5.50. Suponga que una partfcula radiactiva se coloca aleatoriamente 
en un cuadrado con lados de longitud unitaria. Un modelo razonable para la funcion de densidad con¬ 
junta para Fj y F 2 es 


0 <yi < 1,0 <y 2 £ 1, 

en cualquier otro punto. 

a ^Cual es E(Y I - F 2 )? 
b iCual es E(Y I F 2 )? 
c ^Cual es E{Yf + F 2 )? 
d iCual es V(Y 1 F 2 )? 

5.75 Consulte los Ejercicios 5.7, 5.25 y 5.51. Considere que Fj y F 2 tienen la funcion de densidad conjunta 

f e~ (yi+y2> , yi > 0, y 2 > 0 
/(>'!, >'2) = I 

[ 0, en cualquier otro punto. 


f(yu yi) = 








262 Capftulo 5 Distribuciones de probabilidad multivariantes 


a iCuales son E(Y l + Y 2 ) y V(F, + F 2 )? 
b ^Cual es P(Y 1 -Y 2 > 3)? 
c iCual es P(Y 1 - Y 2 < -3)? 
d iCuales son E(Y 1 - F,) y V(Y X - F 2 )? 
e iQue se observa acerca de V(Y 2 + F 2 ) y V(Y 1 - F,)? 

5.76 En el Ejercicio 5.8 dedujimos el hecho de que 

s f 4 Fiy2, 0 < yi < 1, 0 < V 2 ^ 1, 

f(yi, yi) — 

0, en cualquier otro punto. 

a Encuentre E(Y]). 
b Encuentre F(Fi). 
c Encuentre £(F[ — F 2 ). 


5.77 


En el Ejercicio 5.9 determinamos que 

/(Ft, F 2 ) = 


6(1 ~y 2 ), 0 < y, < y 2 l, 

0, en cualquier otro punto 


es una funcion de densidad de probabilidad conjunta valida. Encuentre 

a E(Y\) y E{Y 2 ). 
b V(Y l )yV(Y 2 ). 
c E(Y, - 3F 2 ). 


5.78 


En el Ejercicio 5.10 demostramos que 

f(yl, F 2 ) = 


1, 0 £ yi £ 2, 0 £ y 2 — E 2y 2 — y u 

0, en cualquier otro punto 


es una funcion de densidad de probabilidad conjunta valida para Y v la cantidad de contaminante por 
muestra recolectada arriba de la chimenea sin aparato limpiador y F 2 , la cantidad recolectada arriba de 
la chimenea con el limpiador. 

a Encuentre £(Fj) y £(F 2 ). 
b Encuentre F(F[) y V(F 2 ). 

c La variable aleatoria Fj - F 2 representa la cantidad en la cual el peso de contaminante se puede redu- 
cir con el uso del aparato limpiador. Encuentre E(Y l — F 2 ). 
d Encuentre V(Y 1 - F 2 ). ^.Dentro de que lfmites espera que caiga Fj - F 2 ? 

5.79 Suponga que, como en el Ejercicio 5.11, Fj y F 2 estan uniformemente distribuidas sobre el triangulo 
sombreado en el diagrama siguiente. Encuentre £(FjF 2 ). 



5.80 En el Ejercicio 5.16, Fj y F, denotaron las proporciones del tiempo que los empleados I y II pasaban 
realmente trabajando en sus tareas asignadas durante un dla habil. La densidad conjunta de Y 1 y F 2 esta 
dada por 
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f(y i. yi) 


yi + yi, 0 < yi < 1, 0 < y 2 £ 1, 

0, en cualquier otro punto. 


El empleado I tiene un porcentaje de productividad mas alto que el II y una medida de la productividad 
total del par de empleados es 307] + 257,. Encuentre el valor esperado de esta medida de productivi¬ 
dad. 

5.81 En el Ejercicio 5.18, Fj y Y 2 denotaban la vida util, en cientos de horas, para componentes de tipos I y 
II, respectivamente, en un sistema electronico. La densidad conjunta de F t y F 2 es 

[ (l/S)yie~ (yi+n) / 2 , yi >0,y 2 > 0, 

/(Ft. yi) = { 

[ 0, en cualquier otro punto. 


Una forma de medir la eficiencia relativa de los dos componentes es calcular la relation F 2 / Y v Encuentre 
E(Y 2 /Y i ). [Sugerencia: en el ejercicio 5.61 demostramos que Y l y Y-, son independientes.] 

5.82 En el Ejercicio 5.38 determinamos que la funcion de densidad conjunta para Y v el peso en toneladas 
de un artlculo a granel que un proveedor tiene en existencia y F„ el peso del artlculo vendido por el 
proveedor, tienen densidad conjunta 


f(y l, yi) 


1/yi, 0 <y 2 £ Fi - 1. 

0, en cualquier otro punto. 


En este caso la variable aleatoria Fj - F 2 mide la cantidad del artlculo remanente al final de la semana, 
una cantidad de gran importancia para el proveedor. Encuentre E(Y 1 - F 2 ). 

5.83 En el Ejercicio 5.42 determinamos que la distribution de probabilidad incondicional para F, el numero 
de defectos por yarda en cierta tela, es 


P(y) ~ (1/2) J ’ +1 , y =0,1,2,... 


Encuentre el numero esperado de defectos por yarda. 

5.84 En el Ejercicio 5.62 consideramos dos personas que lanzaban al aire una moneda hasta que aparecla 
la primera cara. Denote con Y 1 y F 2 el numero de veces que las personas A y B tiran la moneda, res¬ 
pectivamente. Si aparecen caras con probabilidad p y cruces con probabilidad q = 1 - p, es razonable 
concluir que Fj y F 2 son independientes y que cada una tiene una distribution geometrica con parametro 
p. Considere Fj - F 2 , la diferencia en el numero de tiros que necesitan las dos personas. 

a Encuentre E(Y l ), E(Y 2 ) y E(Y ] - F 2 ). 

b Encuentre E(Y?), £(F, 2 ) y £(FjF 2 ) (recuerde que Y { y F 2 son independientes). 
c Encuentre E{Y 2 - Y 2 ) 2 y V(Y l - F 2 ). 

d Proponga un intervalo que contenga Y l — F 2 con probabilidad de al menos 8/9. 

5.85 En el Ejercicio 5.65 consideramos variables aleatorias F, y F 2 que, para -1 < o: < 1, tienen funcion de 
densidad conjunta dada por 


/(Ft. F2) 


[1 — or{(l — 2e —yi )(1 -2e~ n )}]e- y '- n , 0 <yi,0 < y 2 , 

0, en cualquier otro punto 


y establecimos que las distribuciones marginales de F t y F, eran exponenciales ambas con media 1. 
Encuentre 


a E(F,) y E(Y 2 ). 
b V(F,) y V(Y 2 ). 
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c E{Y l - Y 2 ). 
d E(F,F 2 ). 

e V(Yi — F 2 ). ^Dentro de que lfmites seesperaquecaiga Fi - F>? 

*5.86 Suponga que Z es una variable aleatoria normal estandar y que Fj y F 2 son variables aleatorias con 
distribucion % 2 con Vj y v, grados de libertad, respectivamente. Ademas, suponga que Z, Fj y F 2 son 
independientes. 

a Defina W = Z/VFJ) Encuentre E(W) y VlHO. ^Que suposiciones se necesitan acerca del valor de 
v{! [Sugerencia: W = Z{\l\/Y\) = g(Z)h(Yi). Use el Teorema 5.9. Los resultados del Ejercicio 
4.112 d tambien seran utiles.] 

b Defina U = Y^/Y^. Encuentre E{U) y V(U). ^Que suposiciones acerca de v 1 y v , se necesitan? Use la 
sugerencia del inciso a. 

5.87 Suponga que Fj y F 2 son variables aleatorias yj independientes con v l y v 2 grados de libertad, respecti¬ 
vamente. Encuentre 

a E(F, + F 2 ). 

b V(Fj + F 2 ). [Sugerencia: use el Teorema 5.9 y el resultado del Ejercicio 4.112a.] 

5.88 Supongamos que lanza un dado hasta que hayan salido cada una de las seis caras. ^,Cual es el numero 
esperado de tiros necesario para completar su tarea? [Sugerencia: si F es el numero de intentos para 
completar la tarea, F = Fj + F 2 + F 3 + F 4 + F 5 + F 6 , donde F t es el intento en el que cae la primera 
cara del dado, Fj = 1, F 2 es el numero de tiros adicionales necesario para que saiga una cara diferente 
a la primera, F 3 es el numero de tiros adicionales necesario para que saiga una cara diferente a las dos 
primeras caras distintas,..., F 6 es el numero de tiros adicionales necesario para que saiga la ultima cara 
restante, despues que todas las otras se hayan visto. Observe ademas que para i = 2,.. . , 6, Y t tiene una 
distribucion geometrica con probabilidad de exito (7 - 1 )/ 6.] 


5.7 Covarianza de dos variables aleatorias 

Intuitivamente consideramos la dependencia de dos variables aleatorias F, y F 2 como un pro- 
ceso en el que una de las variables, por ejemplo F l5 aumenta o disminuye cuando F 2 cambia. 
Concentraremos nuestra atencion en dos medidas de dependencia: la covarianza entre dos 
variables aleatorias y su coeficiente de correlation. En la Figura 5.8(a) y (b), se muestran las 
graficas de los valores observados de dos variables, F, y F 2 , para muestras de n = 10 unida- 
des experimentales tomadas de cada una de las dos poblaciones. Si todos los puntos caen a 
lo largo de una recta, como indica la Figura 5.8(a), F, y F 2 son obviamente dependientes. En 
contraste, la Figura 5.8(b) indica poca o ninguna dependencia entre F, y F 2 . 

Suponga que conocemos los valores de E(Y X ) = j± ] y E(Y 2 ) = /x 2 y localizamos este punto 
en la grafica de la Figura 5.8. Ahora localizamos un punto graficado, (y,, y 2 ), en la Figura 
5.8(a) y medimos las desviaciones (y, - /j,[) y (y 2 - /x 2 ). Ambas desviaciones toman el mismo 
signo algebraico para cualquier punto, (y 1; y 2 ), y su producto (y, - /JL l )(y 2 — p. 2 ) es positivo. Los 
puntos a la derecha de /j., generan pares de desviaciones positivas; los puntos a la izquierda 
producen pares de desviaciones negativas; y el promedio del producto de las desviaciones (yq - 
/j., )(y 2 - /x 2 ) es grande y positivo. Si la relacion lineal indicada en la Figura 5.8(a) se hubiera 
inclinado hacia abajo a la derecha, todos los pares de desviaciones correspondientes hubieran 
sido de signo contrario y el valor promedio de (y, - /x, )(y 2 - /x 2 ) hubiera sido un numero ne- 
gativo grande. 
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FIGURA 5.8 
Observaciones 
dependientes e 
independientes 
para (y v y 2 ) 


DEFINICION 5.10 


■ V 2 


^2 


>2 



















>i 


(a) 


(b) 


La situation que acabamos de describir no ocurre para la Figura 5.8(b), donde existe poca 
dependencia entre Y x y Y 2 . Sus desviaciones correspondientes (y, — p x ) y (y 2 — /x 2 ) tomaran el 
mismo signo algebraico para algunos puntos y signos opuestos para otros. Entonces, el pro- 
ducto (yj - /X|)(y 2 - /x 2 ) sera positivo para algunos puntos, negativo para otros y promediara 
algun valor cercano a cero. 

Es evidente que el valor promedio de (F 1 - pb\){Y 2 — /x 2 ) proporciona una medida de la de¬ 
pendencia lineal entre K, y V 2 . Esta cantidad, E[(Y t - /Xj)(F 2 - /x 2 )|. se denomina covarianza 
de Y 1 y Y 2 . 

Si Y x y Y 2 son variables aleatorias con medias /x, y /x 2 , respectivamente, la covarianza 
de Y x y Y 2 es 

Covcyj, F 2 ) = e [(Y\ - mXY 2 - Hi)] ■ 


Cuanto mayor sea el valor absoluto de la covarianza de K, y Y 2 , mayor sera la dependencia 
lineal entre Y x y K 2 . Los valores positivos indican que Y ] aumenta cuando K 2 aumenta; los 
valores negativos indican que Y x disminuye cuando Y 2 aumenta. Un valor cero de la covarian¬ 
za indica que las variables son no correlacionadas y que no hay dependencia lineal entre K, 

y y 2 . 

Desafortunadamente, es diffcil utilizar la covarianza como medida absoluta de dependen¬ 
cia porque su valor depende de la escala de medicion. En consecuencia, es diffcil determinar 
a primera vista si una covarianza particular es grande o pequena. Este problema se puede eli- 
minar al estandarizar su valor y usar el coeficiente de correlacion, p, una cantidad relacionada 
con la varianza y que se define como 


Cov( Y \, Y 2 ) 

P = - 

0-102 


donde ctj y cr 2 son desviaciones estandar de Y x y Y 2 , respectivamente. Se pueden hallar mas 
exposiciones del coeficiente de correlacion en la obra de Hogg, Craig y McKean (2005) y 
Myers (2000). 

Una demostracion del coeficiente de correlacion p satisface la desigualdad -1 < p < 1 esta 
resumida en el Ejercicio 5.167. 
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TEOREMA 5.10 

Demostracion 


EJEMPLO 5.22 

Solucion 


El signo del coeficiente de correlacion es igual al signo de la covarianza. Entonces, p > 0 
indica que Y 2 aumenta a medida que Y 2 aumenta y p = +1 implica correlacion perfecta, con 
todos los puntos cayendo en una recta con pendiente positiva. Un valor de p = 0 implica 
cero covarianza y que no hay correlacion. Un coeficiente negativo de correlacion implica una 
disminucion en Y 2 cuando K, aumenta, y p = -1 implica correlacion perfecta, con todos los 
puntos cayendo en una recta con pendiente negativa. Una formula computacional conveniente 
para la covarianza se especifica en el siguiente teorema. 


Si Ej y Y 2 son variables aleatorias con medias p [ y p 2 . respectivamente, entonces 
Cov(7i, Y 2 ) = E [(7, - M i)(E 2 -ix 2 )] = E(Y\ Y 2 ) - E(Y l )E(Y 2 ). 

Co \(Yi, Y 2 ) = E [(7, - pn)(Y 2 - M2 )] 

= E(Y\Y 2 — p-i Y 2 — p 2 Y\ + p-ip. 2 ). 

Del Teorema 5.8, el valor esperado de una suma es igual a la suma de los valores espera- 
dos; y del Teorema 5.7, el valor esperado de una constante multiplicado por una funcion 
de variables aleatorias es la constante por el valor esperado. Entonces, 

Cov(Fi, Y 2 ) = E(YiY 2 ) - imE(Y 2 ) - n 2 E(Yi) + mn 2 . 

Como £(Fj) = p | v E{Y 2 )= p, 2 , se deduce que 

CovtF!, Y 2 ) = E(J x Y 2 ) - E{Y l )E{Y 2 ) = E{Y x Y 2 )-p^ 2 . 


Consulte el Ejemplo 5.4. Encuentre la covarianza entre la cantidad en existencia Y t y la canti- 
dad de ventas Y 2 . 


Recuerde que Y t y Y 2 tienen funcion de densidad conjunta dada por 

3 Vi, 0<y 2 <y!<l, 


f(y i, ?2) = 


o. 


en cualquier otro punto. 


Entonces, 


E(Y X Y 2 ) 


a: 

i: 


yxyiOyi) dy 2 dy x = 3y 


f 

Jo 


3 4 t * I y i 

0^1 = o T 


5 11 


Joy 


3 

To' 



dy i 


Del Ejemplo 5.20, sabemos que E(Y^) = 3/4 y E(Y 2 ) = 3/8. Entonces, usando el Teorema 
5.10, obtenemos 

Cover!, Y 2 ) = E(Y x Y 2 ) - E(Y x )E(Y 2 ) = (3/10) - (3/41(3/8) = .30 - .28 = .02. 


En este ejemplo, valores grandes de Y 2 pueden presentarse solo con valores grandes de 
Y { y la densidad,/(>’i, y 2 ), es mas grande para valores mas grandes de Y 1 (vea la Figura 5.4). 
Entonces, intuimos que la covarianza entre K, y Y 2 debe ser positiva. ■ 
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EJEMPLO 5.23 Tengan K, y Y 2 densidad conjunta dada por 

\2y u 0 < yi < 1 , 0 < y 2 =£ 1 , 

f(yuyi) = \ n , . 

I 0, en cualqtuer otro punto. 

Encuentre la covarianza de K 1 y K 2 . 

Solucion Del Ejemplo 5.15, E(Y ] Y 2 ) = 1/3. Tambien, de los Ejemplos 5.16 y 5.17, /jl 1 = E{Y j) = 2/3 
y fi 2 = E( Y 2 ) = 1/2, y 

Cov(Yi, Y 2 ) = E(Y 1 Y 2 ) -him = (1/3) - (2/3)(l/2) =0. B 


El Ejemplo 5.23 proporciona un caso especffico del resultado general dado en el Teorema 
5.11. 


TEOREMA 5.11 Si Y x y Y 2 son variables aleatorias independientes, entonces 

Cov(7i, Yi) = 0. 

Asf, las variables aleatorias independientes deben ser no correlacionadas. 

Demostracion El Teorema 5.10 establece que 

Cov(Y u Y 2 ) = E{YxY 2 ) — ahju- 2- 
Como K, y Y 2 son independientes, el Teorema 5.9 implica que 

E{Y X Y 2 ) = e{Y\)E{y 2 ) =mn 2 , 
y el resultado deseado se deduce de inmediato. 


Observe que las variables aleatorias Y ; y Y 2 del Ejemplo 5.23 son independientes; en con- 
secuencia, por el Teorema 5.11, su covarianza debe ser cero. El recfproco del Teorema 5.11 no 
es verdadero, como se ilustra en el ejemplo siguiente. 


EJEMPLO 5.24 Sean T : y Y 2 variables aleatorias discretas con distribucion de probabilidad conjunta como se 
ve en la Tabla 5.3. Demuestre que Tj y Y 2 son dependientes pero tienen covarianza cero. 

Solucion El calculo de probabilidades marginales da /?/-!) = /? ,( 1) = 5/16 = p 2 (~ I ) = p 2 (l) y /?,(0) 
= 6/16 = p 2 ( 0). El valoi' p((), 0) = 0 en la celda del centra se destaca. Obviamente, 


Tabla 5.3 Distribucion de probabilidad conjunta, Ejemplo 5.24 


yi 


yi 


-l 

0 

+ 1 

-l 

1/16 

3/16 

1/16 

0 

3/16 

0 

3/16 

+i 

1/16 

3/16 

1/16 
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P( 0, 0)* Pl (0)p 2 (0), 

y esto es suficiente para demostrar que Y x y Y 2 son dependientes. 

Observando de nuevo las probabilidades marginales, vemos que E(Y X ) = E(Y 2 ) = 0. 
Tambien, 

E(Y,Y 2 ) = EE yiyipiyu yi) 

toda yi toda y>2 

= (—1)( —1)(1/16) + (-1)(0)(3/16) + (-1)(1)(1/16) 

+ (0)(-1X3/16) + (0)(0)(0) + (0X1X3/16) 

+ (1)(-1)(1/16) + (1)(0)(3/16) + (1)(1)(1/16) 

= (1/16) - (1/16) - (1/16) + (1/16) = 0. 


Entonces, 

Cov(F 1> Y 2 ) = E{Y{Y 2 ) - E(Y l )E(Y 2 ) = 0 - 0(0) = 0. 

Este ejemplo demuestra que el reclproco del Teorema 5.11 no es verdadero. Si la covarian- 
za de dos variables aleatorias es cero, las variables no necesitan ser independientes. ■ 


Ejercicios 


5.89 En el Ejercicio 5.1 determinamos que la distribucion conjunta de Y x , el numero de contratos concedidos 
a la empresa A, y Y 2 , el numero de contratos concedidos a la empresa B, esta dada por las entradas en la 
tabla siguiente. 


5.90 


yi 


yi 


0 

l 

2 

0 

1/9 

2/9 

1/9 

l 

2/9 

2/9 

0 

2 

1/9 

0 

0 


Encuentre Cov(F t , Y 2 ). ^Le sorprende que CovfX, Y 2 ) sea negativa? ^Por que? 

En el Ejercicio 5.3 determinamos que la distribucion de probabilidad conjunta de Y x , el numero de eje- 
cutivos casado, y Y 2 , el numero de ejecutivos nunca casados, esta dada por 


p(y l, yi) = 



5.91 


donde y t y y, son enteros, 0 £ yj £ 3, 0 £ y 2 — 3 y 1 — yi + v 2 — 3. Encuentre CovfFj, Y 2 ). 


En el Ejercicio 5.8 dedujimos el hecho que 


f(y l. yi) 


4yiy 2 , 0 £ yi <l,0Syj<l, 
0, en cualquier otro punto. 


Demuestre que CovCFj, F,) = 0. ^.Le sorprende que Cov(Fj, F 2 ) sea cero? ^Por que? 
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5.92 En el Ejercicio 5.9 determinamos que 

,. . f 6(1 — _v 2 ), 

f(yu yi) = \ „ 

I 0, en cualquier otro punto 

es una funcion de densidad de probabilidad conjunta valida. Encuentre Cov(Fj, Y 2 ). i l Y 1 y Y 2 son inde- 
pendientes? 

5.93 Suponga que, al igual que en los Ejercicios 5.11 y 5.79, Fj y Y 2 estan uniformemente distribuidas sobre 
el triangulo sombreado del diagrama siguiente. 



a Encuentre Cov(Fj, Y 2 ). 

b iY x y Y 2 son independientes? (Vea el Ejercicio 5.55.) 
c Encuentre el coeficiente de correlation para Y x y Y 2 . 

d ^La respuesta al inciso b lo lleva a dudar de su respuesta al inciso a? ^,Por que si o por que no? 

5.94 Sean Ij y Y 2 variables aleatorias no correlacionadas y considere U 1 = Y 1 + Y 2 y U-, — Y 1 - Y 2 . 

a Encuentre la Cov(t/j, U 2 ) en terminos de las varianzas de Fj y Y 2 . 
b Encuentre una expresion para el coeficiente de correlacion entre U l y U 2 . 
c ^Es posible que Cow(U l , (/,) = 0? ^Cuando ocurre esto? 

5.95 Consideremos que las variables aleatorias discretas Fj y Y 2 tienen la funcion de probabilidad conjunta 

p{y uyi) = 1/3, para (>'i, y 2 ) = (-1,0), (0, 1), (1, 0). 

Encuentre Cov(F t , Y 2 ). Observe que F, y Y 2 son dependientes. (^Por que?) Este es otro ejemplo de va¬ 
riables aleatorias no correlacionadas que no son independientes. 

5.96 Suponga que las variables aleatorias fj y Y 2 tienen medias y /u,, y varianzas of y a 2 , respecdvamente. 
Use la definicion basica de la covarianza de dos variables aleatorias para establecer que 

a CovCFi, Y 2 ) = Cov(E 2 , Y { ). 

b Cov(Fi, Pi) = V(Yi) = of. Esto es, la covarianza de una variable aleatoria y ella misma son solo la 
varianza de la variable aleatoria. 

5.97 Las variables aleatorias Fj y Y 2 son tales que E{Y X ) = 4, E{YY) = -1, P(Fj) = 2 y V(Y 2 ) = 8. 
a ^Cual es Cov(F,, F,)? 

b Suponiendo que las medias y las varianzas sean correctas, i es posible que Cov(Fj, F 2 ) = 7? 

[, Sugerencia: si Cov(Fj, F 2 ) = 7, ^,cual es el valor de p, el coeficiente de correlacion?] 
c Suponiendo que las medias y las varianzas sean correctas, ^cual es el maximo valor posible para 
Cov(Fj, F 2 )? Si Cov(F!, F 2 ) alcanza este valor maximo, ^que implica eso acerca de la relation entre 
Fi y F 2 ? 
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d Suponiendo que las medias y las varianzas sean correctas, ^cual es el mmimo valor posible para 
Cov(Fj, F,)? Si Cov(Fj, F 2 ) alcanza este valor mmimo, ^que implica esto acerca de la relacion entre 

5.98 iQue tan grande o pequena puede ser Cov(Fj, F 2 )? Use el dato de que p 2 £ 1 para demostrar que 

V(L) X V(Y 2 ) < CovCFj, F 2 ) < VV'd'i) X V(F 2 ). 

5.99 Si c es cualquier constante y Fes una variable aleatoria tal que E(Y) existe, demuestre que Cov (c, F) = 0. 

5.100 Sea Z una variable aleatoria normal estandar y sean Y l = Z y F 2 = Z 2 . 
a i Cuales son E(Y t ) y £(F,)? 

b ^Cual es £(FjF 2 )? [Sugerencia: £(FjF 2 ) = £(Z 3 ), recuerde el Ejercicio 4.199.] 
c iCual es Cov(F 15 F 2 )? 

d Observe que P(Y 2 >l|Fj > 1) = 1. ^Fj y F 2 son independientes? 

5.101 En el Ejercicio 5.65 consideramos variables aleatorias Fj y F 2 que, para -1 < a £ 1, tienen funcion de 
densidad conjunta dada por 

[ [1 -£*{(1 -2e“«)(l — 2e~ y2 )}]e~ y, ~ y2 , 0<y,,0<y 2 , 

f(yuYi) = j 

l 0, en cualquier otro punto. 

Establecimos que las distribuciones marginales de F t y F 2 son ambas exponenciales con media 1, y de- 
mostramos que Y x y F 2 son independientes si y solo si a = 0. En el Ejercicio 5.85 dedujimos £(FjF,). 

a Derive Cov(Fj, F 2 ). 

b Demuestre que CovfFj, Y-,) = 0 si y solo si a = 0. 
c Demuestre que Fj y F 2 son independientes si y solo si p = 0. 


5.8 Valor esperado y varianza de funciones 
lineales de variables aleatorias 

Mas adelante en este texto, en especial los Capitulos 9 y 11, frecuentemente encontraremos 
estimadores que son funciones lineales de las mediciones en una muestra, Y V Y 2 ,, Y n . Si a 1? 
a 2 . . . ,a n son constantes, sera necesario calcular el valor esperado y varianza de una funcion 
lineal de las variables aleatorias F,, Y 2 ,. . ., Y n . 


n 

U\ = a\Y\ + ci 2 Y 2 + CI 3 Y 2 +. . . + a„Y n = a,F,-. 

i=l 


Tambien podemos estar interesados en la covarianza entre dos de estas combinaciones linea¬ 
les. Los resultados que simplifican el calculo de estas cantidades se resumen en el teorema 
siguiente. 
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TEOREMA 5.12 Sean Y r , Y 2 , . . . , Y n y X { , X n , . . . , X m variables aleatorias con E(Y-) = j± : y E(Xj) = 
Defina 

n m 

U\ = y u 2 = Yl b J x J 

i=l 7=1 

para las constantes a { , a 2 ,.... a n y b v b 2 ,..., b m . Entonces se cumple lo siguiente: 
a E(Ui) = J2"=i a i^i- 

b V(Ui) = Y,'i=\ a l v i Y i) + 2 J2I2i^i<jsn a ‘ a j Cov ( Y i’ Y / Y donde ladoble 
suma es para todos los pares (i, j ) con i < j. 

c Co v(U u U 2 ) = T.U E7=i cubjCoviYi, Xj). 


Antes de continuar con la demostracion del Teorema 5.12, ejemplificaremos su uso. 


EJEMPLO 5.25 Sean Y v Y 2 y Y 3 variables aleatorias, donde E(Y\) = 1, E{Y 2 ) = 2, E(Y 3 ) = —1, V(Y\) = 1, 
V(Y 2 ) = 3, V(T 3 ) = 5, Cov(Fi, F 2 ) = -0.4, Cov(Ti, T 3 ) = 1/2 y Cov(T 2 , Y 3 ) = 2. En- 
cuentre el valor esperado y la varianza d e U = Y { — 2Y 2 + Y v Si W = 3 Y\ + Y 2 , encuentre 
Co \r(U, W). 

Solucion U = a{Y\ +a 2 Y 2 +a 3 Y 3 , donde rq = 1, a 2 = -2 y a 3 = 1. Entonces, por el Teorema 5.12, 
E(U) = a\E(Y\) + a 2 E(Y 2 ) + a 3 E(Y 3 ) = (1)(1) + (—2)(2) + (T)( —1) = -4. 

De manera similar, 

V(U) = a^V(Yi) + a\V(Y 2 ) + a 3 V(Y 3 ) + 2a 1 a 2 Cov(T 1 , Y 2 ) 

+ 2flifl3Cov(Fi, Y 3 ) + 2a 2 a 3 Cov(Y 2 , Y 3 ) 

= (1) 2 (1) + (-2) 2 (3) + (1) 2 (5) + (2)(1)(—2)(—0.4) 

+ ( 2 )( 1 )( 1 )( 1 / 2 ) + ( 2 )( — 2 )( 1 )( 2 ) 

= 12 . 6 . 

Observe que W = b l Y l + b 2 Y 2 , donde b l = 3 y b 2 = 1. Entonces, 

Cov([/, W) = a\b\Cov(Y\, Y \) + a\b 2 Cov(Y\, Y 2 ) + a 2 b\Cov(Y 2 , Y\) 


+ a 2 b 2 Cov(Y 2 , Y 2 ) + a 3 b\Co\{Y 3 , Y i) + a 3 b 2 Cov(F3, Y 2 ). 
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Demostracion 


Observe que, como se establece en el Ejercicio 5.96, C’ov( Y : , Yj) = Cov( Yj , Y,) y Cov( Y, , 
Yj) = V(Yj). Por tanto, 

Co v(U, W) = (1)(3)(1) + (1)(1)(—0.4) + (—2)(3)( —0.4) 

+ ( 2)( 1)(3) + (1)(3)( 1/2) + (1)(1)(2) 

= 2.5. 

Como Cov( U, W) A 0, sc deduce que U y W son dependientes. ■ 


Ahora continuamos con la demostracion del Teorema 5.12. 


El teorema consta de tres partes, de las cuales (a) viene directamente de los Teoremas 
5.7 y 5.8. Para demostrar (b) recurrimos a la definicion de varianza y escribimos 


= E 


= E 


V(Ui) = E [U\ — £(t/i)] 2 = E J2 a ‘ Yi 

_i = 1 i =1 

-i2 

n 

- pi) 

_i = 1 

- n n n 

- /A,-) 2 + EE^(F, - P>i)(Yj - pj) 

T~t i= 'j=' 

‘fj 

n n 

= TafEiYi - p t ) 2 + EE«, ajE[(Y, -ptKYj -pj)]. 

i =l i=1 J =1 

Por las definiciones de varianza y covarianza tenemos 

n " » 

V(t/i) = J^afViYi) + Cov(F/, Y)). 


1 = 1 i=l 
ifj 


Como Cov(Yj, F y ) = Cov(Yj, Y { ), podemos escribir 

n 

V{U X ) = y^afViYi) +2y2J2 a ‘ a j Cov(r '-’ Y > ) - 

i = 1 1< / < y</7 

Se pueden usar pasos similares para obtener (c). Tenemos 
Cov(£/i, U 2 ) = E{[Ui - E(U i)] [U 2 - E(U 2 )]} 

= E 


J2 Ui Yt -j2 a iPiJ\J2 b j x j -J2 b > & 


<i = 1 


i=l 


= E 


y^aiiYi - pi) 


i = 1 


'ijrhj&j-ej) 

U=i 
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= E 


Y^oihjw - KWj - & 

,i = 1 7=1 


= EE OibjEUYt -in)(Xj-€j)] 

1=1 7=1 
n m 

= EE cijbj Cov( F,, X/). 

i=l 7 = 1 


A1 observar que Cov(lj, Yj = V(Yj, podemos ver que (b) es un caso especial de (c). 


EJEMPLO 5.26 Consulte los Ejemplos 5.4 y 5.20. En el segundo estuvimos interesados en F, - Y 2 , la can- 
tidad proporcional de gasolina restante al final de una semana. Encuentre la varianza de 

Yi-Y* 

Solucion Usando el Teorema 5.12, tenemos 

V(Yi - Y 2 ) = V(Y 1 ) + V(Y 2 ) - 2 CovCEi, F 2 ). 


Como 


fi(yi) 


3 yf, 0<yi<l, 

0, en cualquier otro punto, 


y 


se deduce que 


fiiyi) 


(3/2)(l — y 2 ), 0 — y 2 — 1, 

0, en cualquier otro punto. 



3 

5’ 


/' 


E(Y$= I \y 2 2 0-yl)dy 2 = ^ 


1 

5' 


Del Ejemplo 5.20 tenemos E( K ,) = 3/4 y E(Y n ) = 3/8. Entonces, 

V (Fi) = (3/5) - (3/4) 2 = .04 y V(Y 2 ) = (1/5) - (3/8) 2 = .06. 

En el Ejemplo 5.22 determinamos que Cov(F[, F 2 ) = .02. Por tanto, 

F(Pi - F 2 ) = V(F0 + V(Y 2 ) - 2 Cov(Fj, F 2 ) 

= .04+ .06-2(.02) = .06. 


La desviacion estandar de F, - F 2 es entonces V'/06 = .245. 
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EJEMPLO 5.27 


Sean Y v Y 2 , . . . , Y n variables aleatorias independientes con E(JQ = /jl v V( Y t ) = cr 2 . (Estas 
variables pueden denotar los resultados de n intentos independientes de un experimento.) 
Defina 


Y = 



y demuestre que E(Y) = /jl y V(Y) = a 2 / n. 

Solucion Observe que Y es una funcion lineal de Y v Y 2 , . . . , Y n con todas las constantes a t iguales a 
1 /n. Esto es, 


Y = 




Por el Teorema 5.12(a), 

n n n n -y 

E(Y) = ^aiHi = = = fi^2~ = — =ii. 

i =t ;=i i=i i=i ” n 

Por el Teorema 5.12(b), 

n " n 

V(Y) = TafV(Yi)+2 HHataj Cov( Y t , Yj). 

,=i i=1 i=1 

KJ 


Los terminos de la covarianza son todos iguales a cero porque las variables aleatorias son 
independientes. Entonces, 


n / i \ 2 n / i \ 2 « n 9 2 


i=i 


i=i 


i = l 


EJEMPLO 5.28 El numcro de articulos defectuosos Y en una muestra de n = 10 articulos seleccionados del 
proceso de fabricacion tiene una distribucion de probabilidad binomial. Un estimador de la 
fraccion defectuosa del lote es la variable p= Y/n . Encuentre el valor esperado y la varianza 
de p. 


Solucion El te'rmino /5es una funcion lineal de una sola variable Y, donde p = a , Y y a { = 1 / n. Entonces, 
por el Teorema 5.12, 

E(p) =ai E(Y) = -E(Y). 

n 

El valor esperado y la varianza de una variable aleatoria binomial son up y npq, respectiva- 
mente. Sustituyendo por E(Y), obtenemos 

1 

E{p) = ~(np) = p. 
n 
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Entonces, el valor esperado del numero de articulos defectuosos Y. dividido entre el tamano 
muestral, es p. Del mismo modo 

V(p)= a\V(Y)= (~\ npq= ■ 

\ n ) n 


EJEMPLO 5.29 Suponga que una urna contiene r bolas rojas y (N — r) bolas negras. Una muestra aleatoria 
de n bolas se saca sin restitucion y se observa Y, el numero de bolas rojas de la muestra. Del 
Capftulo 3 sabemos que Y tiene una distribution de probabilidad hipergeometrica. Encuentre 
la media y la varianza de Y. 


Solution Primero observamos algunas caracterfsticas de muestrear sin restitucion. Suponga que el 
muestreo se realiza en forma secuencial y observamos resultados para Aj, X 2 , . . ., X n , donde 

1, si el z-esimo resultado es una bola roja, 

Xi = 

0, en caso contrario. 

Incuestionablemente, P(X { = 1)= r/N. Pero tambien es cierto que P(X 2 = 1) = r/N porque 

P(X 2 = 1) = P{X x = 1, Z 2 = 1) + P(X i =0,X 2 = 1) 

= P(X i = 1 )P(X 2 = l|Xj = 1) + P{X i = 0 )P(X 2 = l\Xi = 0) 

_ / r\ / r - ! \ ( N ~ r \( r \ _ r(N ~ 1) _ r 

~ \n) \N - \) V N ) \N - l) ~ N(N - l) ~ N' 


Lo mismo es cierto para X t ; esto es, 


P(X k = 1)= —, k= 1,2,..., n. 

N 

Entonces, la probabilidad (incondicional) de sacar una bola roja en cualquier ensayo es r/N. 
Del mismo modo, se puede demostrar que 


P(Xj = \,X k = 1 ) = 


r(r - 1 ) 
N(N- 1 )’ 


j t k. 


Ahora, observe que Y = i A, y por lo tanto, 

i= 1 i =1 

Para hallar V(Y) necesitamos V(X t ) y Cov(Z ; , Xp. Como X f es 1 con probabilidad r/N y 0 
con probabilidad 1 - (r/N), se deduce que 


V(Xi) 
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Tambien, 


Cov(X„ ¥,) - FIX, X ,I - FtX,<FAX,, - ^ 

= _L Cl - M 

N\ N' \N - 1 / 


porque X i Xj = 1 si y solo si X t = I v X f = 1 y X t X- = 0 en caso contrario. Del Teorema 5.12, 
sabemos que 


V{Y ) = J2 + 2 EE Cov(X f , Xj) 

1=1 i< 7 


E©0-s)-EE -£( 

1=1 KJ L 


~ 1 — N 


/V - 1 


-G)( 1 -5)-<-«(5)( 


- Ul -« 


N - 1 


porque la doble sumatoria contiene n(n - l)/2 terminos iguales. Un poco de algebra dara 
como resultado 


V(Y) = n 



Para apreciar la utilidad del Teorema 5.12, Observe que las deducciones contenidas en 
el Ejemplo 5.29 son mucho mas sencillas que las resumidas en el Ejercicio 3.216, donde la 
media y la varianza se dedujeron usando las probabilidades asociadas con la distribucion 
hipergeometrica. 


Ejercicios 

5.1 02 Una empresa compra dos tipos de productos qmmicos industriales. El producto tipo I cuesta $3 el galon, 

mientras que el tipo II cuesta $5 por galon. La media y la varianza para el numero de galones comprado 
del producto tipo I, Y lt son 40 y 4, respectivamente. La cantidad comprada del producto tipo II, Y 2 , tiene 
E(Y 2 ) = 65 galones y = 8- Suponga que Lj y Y 2 son independientes y encuentre la media y la 

varianza de la cantidad total de dinero gastado por semana en los dos productos qufmicos. 

5.1 03 Suponga que Y v Y 2 y Y 3 son variables aleatorias, con 

E(Yi) = 2, E(Y 2 ) = -1, E(Y 3 ) = 4, 

V(Ti) = 4, V(Y 2 ) = 6, V(F 3 ) = 8, 

Cov(Fi, Y 2 ) = 1, Cov(L,, y 3 ) = -1, Cov(L 2 , F 3 ) = 0. 


5.104 


Encuentre £(3L, + 4F 2 - 6F 3 ) y V(3Y { + 4F 2 - 6F 3 ). 

En el Ejercicio 5.3 determinamos que la distribucion de probabilidad conjunta de Y v el numero de eje- 
cutivos casados y F 2 , el numero de ejecutivos nunca casados, esta dada por 


p(yi, yY) 
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donde y 2 y y 2 son enteros, 0 £ yj £ 3, 0 ^ y 2 — 3 y 1 £ y 1 + y 2 £ 3. 

a Encuentre E(Y i + F 2 ) y V(Y 1 + Y 2 ) hallando primero la distribution de probabilidad de Fj + F 0 . 
b En el Ejercicio 5.90 determinamos que Cov(Fj, F 2 ) = -1/3. Encuentre E(Y t + F 2 ) y V(Y t + Y 2 ) 
usando el Teorema 5.12. 

5.105 En el Ejercicio 5.8 establecimos que 

| 4yiy 2 , 0 ^ yi < 1, 0 £ y 2 ^ 1, 
f(yu yi) = | 

I 0, en cualquier otro punto 

es una funcion de densidad de probabilidad conjunta valida. En el Ejercicio 5.52 establecimos que F, 
y F 2 son independientes; en el Ejercicio 5.76 determinamos que E(Y l - Y 2 ) = 0 y encontramos el valor 
para V(Fj). Encuentre V(Y t - F 2 ). 

5.106 En el Ejercicio 5.9 determinamos que 

f 6(1 - y 2 ), 0 < Vi £ y 2 £ 1, 

/Ob. Fa) = 

I 0, en cualquier otro punto 

es una funcion de densidad de probabilidad conjunta valida. En el Ejercicio 5.76 dedujimos el hecho 
que £(Fj - 3F 2 ) = -5/4; en el Ejercicio 5.92 demostramos que Cov(Fj, F,) = 1 /40. Encuentre V(Y l - 
3F 2 ). 

5.107 En el Ejercicio 5.12 se establecio la siguiente funcion de densidad de probabilidad conjunta para las 
variables aleatorias Fj y F 2 , que fueron las proporciones de dos componentes de una muestra de una 
mezcla de insecticida: 

[2, 0 £ yi £ 1, 0 £ v 2 ^ 1, 0 £ yi + v 2 ^ 1. 

/(y t.y 2 ) = | 

I 0, en cualquier otro punto. 

Para los dos productos quimicos en consideracion, una cantidad importante es la proporcion total 
Fj + F 2 hallada en cualquier muestra. Encuentre E(Y X + F 2 ) y V(Y i + F 2 ). 

5.108 Si Fj es el tiempo total entre la llegada de un cliente a la tienda y su salida de la ventanilla de servicio, 
y si F 2 es el tiempo que pasa en la fila de espera antes de llegar a la ventanilla, la densidad conjunta de 
estas variables se dio en el Ejercicio 5.15 como 

{ e~ yi , 0 < y 2 £ yi £ oo, 

0, en cualquier otro punto. 

La variable aleatoria Fj - F 2 representa el tiempo que pasa en la ventanilla de servicio. Encuentre 
£(Fj - F 2 ) y V/Fj - F 2 ). ^Es altamente probable que un cliente seleccionado aleatoriamente pase mas de 
4 minutos en la ventanilla de servicio? 

5.109 En el Ejercicio 5.16, Fj y F 2 denotaron las proporciones de tiempo que los empleados I y II en realidad 
dedicaron a trabajar en sus tareas asignadas durante una jomada. La densidad conjunta de Fj y F 2 esta 
dada por 

I yi + y 2 , OSyi <l,0Sy2<l, 

/(yi,y 2 ) = 

I 0, en cualquier otro punto. 

En el Ejercicio 5.80 dedujimos la media de la medida de productividad 30Fj + 25F 2 . Encuentre la va- 
rianza de esta medida de productividad. Proporcione un intervalo en el que piense que las medidas de 
productividad total de los dos empleados deben estar al menos 75% de los dfas en cuestion. 

5.110 Suponga que Fj y F 2 tienen coeficiente de correlacion p = .2. ^Cual es el valor del coeficiente de corre- 
lacion entre 
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a 1 + 2Y, y 3 + 4F 2 ? 
b 1 + 2Yt y 3 - 4F 2 ? 
c 1 - 27j y 3 - 4F 2 ? 

5.111 Suponga que Fj y F 2 tienen coeficiente de correlacion p Y , Yl y para las constantes a, b, cy d sea W 1 = 
o + bY l y W, = c + dY 2 . 

a Demuestre que el coeficiente de correlacion entre W x y W 2 , p Wl Wl , es tal que |p y y | = \p w Wr> \, 
b ^Este resultado explica los resultados obtenidos en el Ejercicio 5.110? 

5.112 En el Ejercicio 5.18, Fj y Y 2 denotaban las vidas utiles, en cientos de horas, para componentes de tipos 
I y II, respectivamente, en un sistema electronico. La densidad conjunta de Fj y Y 2 es 

f (l/8)yie" (3 ' 1+ -'’ 2)/2 , yi >0,y 2 > 0, 

f(yu yi) = \ 

[ 0, en cualquier otro punto. 


El costo C de cambiar los dos componentes depende de la duration de sus vidas utiles cuando fallan y 
esta dada por C = 50 + 2Y 1 + 4F,. Encuentre E(C) y V(C). 

5.113 Una comerciante minoristapiensa que su ganancia diariaX, obtenida de sus ventas, es una variable alea- 
toria normalmente distribuida con p = 50 y cr = 3 (mediciones en dolares). X puede ser negativa si ella 
se ve forzada a deshacerse de suficientes artlculos perecederos. Del mismo modo, calcula que los costos 
generales diarios Y tienen una distribution gamma con a = 4 y /3 = 2. Si X y F son independientes, 
encuentre el valor esperado y la varianza de la ganancia diaria neta de la comerciante. ^Es de esperarse 
que su ganancia neta para manana rebase los $70? 

5.114 Para la production diaria de una operation industrial, denote con Ij la cantidad de ventas y F ? , los cos¬ 
tos, en miles de dolares. Suponga que las funciones de densidad para Y 1 y Y 2 estan dadas por 


/i(yi) 


(l/6)yle yi , yi > 0, 

0 , yi — 0 , 


y / 2 (y 2 ) 


(l/2)e“»/ 2 , y 2 > 0, 

0, y 2 — 0. 


La utilidad diaria esta dada por U = Ij - Y 2 . 
a Encuentre E( U). 

b Suponiendo que Y l y Y 2 son independientes, encuentre V( U). 

c iSe esperaria que la utilidad diaria cayera por debajo de cero con mucha frecuencia? ^,Por que? 

5.115 Consulte el Ejercicio 5.88. Si Y denota el numero de tiros del dado hasta que se vea cada una de las seis 
caras, Y = Fj + Y 2 + Y 3 + Y 4 + Y s + Y 6 donde Fj es el intento en el que se lanza la primera cara del 
dado, Fj = 1, F, es el numero de tiros adicionales necesario para que saiga una cara diferente a la pri¬ 
mera, F 3 es el numero de tiros adicionales necesario para que saiga una cara diferente a las dos primeras 
caras distintas,... , F 6 es el numero de tiros adicionales necesario para que saiga la ultima cara restante, 
despues de que todas las otras se hayan visto. 

a Demuestre que Cov(F;, Fj) = 0 ,i,j— 1, 2,. . . , 6, i + j. 
b Use el Teorema 5.12 para hallar V{Y). 

c Proponga un intervalo que contenga a F con probabilidad de al menos 3 /4. 

5.116 Consulte el Ejercicio 5.75. Use el Teorema 5.12 para explicar por que V(Y t + F 2 ) = V(Y X - F,). 

*5.117 Una poblacion de N lagartos se ha de muestrear para obtener una medida aproximada de la diferencia 
entre las proporciones de machos y hembras sexualmente maduros. Es evidente que este parametro tiene 
importantes implicaciones para el futuro de la poblacion. Suponga que n animales se han de muestrear 
sin restitution. Denote con Fj el numero de hembras maduras y con F 2 el de machos maduros de la 
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muestra. Si la poblacion contiene proporciones p x y p 2 de hembras y machos maduros, respectivamente 
(con Pi + p 2 < 1), encuentre expresiones para 



5.11 8 La carga total sostenida en la cimentacion de concreto de un edificio proyectado es la suma de la carga 
muerta mas la carga de ocupacion. Suponga que la carga muerta tiene una distribucion gamma con 
ai = 50 y Pi = 2, mientras que la carga de ocupacion X 2 tiene una distribucion gamma con a, = 20 y 
/6 2 = 2. (Las unidades son en miles de libras.) Suponga que Xj y X 2 son independientes. 

a Encuentre la media y la varianza de la carga sostenida total en la cimentacion. 
b Encuentre un valor para la carga sostenida que sera rebasada con probabilidad menor que 1/16. 


5.9 Distribucion de probabilidad multinomial 

Recuerde del Capftulo 3 que una variable aleatoria binomial resulta de un experimento que 
consiste en n intentos con dos posibles resultados por intento. Con frecuencia encontramos 
situaciones similares en las que el numero de posibles resultados por intento es mas que dos. 
Por ejemplo, experimentos que comprenden tipos de sangre por lo general tienen al menos 
cuatro posibles resultados por intento. Experimentos que comprenden el muestreo de articulos 
defectuosos pueden clasificar el tipo de defectos observados en mas de dos clases. 

Un experimento multinomial es una generalization del experimento binomial. 

DEFINICION 5.11 Un experimento multinomial posee las siguientes propiedades: 

1. El experimento consta de n intentos identicos. 

2. El resultado de cada intento cae en una de k clases o celdas. 

3. La probabilidad de que el resultado de un solo intento caiga en la celda i, es p t , 
i = 1,2,..., k y sigue siendo el mismo de un intento a otro. Observe que p { + p 2 + 

Pi + ' ' ' + Pk = 1 - 

4. Los intentos son independientes. 

5. Las variables aleatorias de interes son Y u Y 2 ,. .., Y k , donde Y l es igual al numero 
de intentos para los cuales el resultado cae en la celda i. Observe que Y x + Y 2 + 

Y 3 + ■ ■ ■ + Y k = n. 


La funcion de probabilidad conjunta para Y l? Y 2 , ... ,Y k esta dada por 

p(yu yi, yn)= , ■ ■ ■ P y k l > 

yi \y 2 \■■■ y k l 

donde 

Y.P‘ = ] y Y, yi = n - 

i=i i=i 

Calcular la probabilidad de que los n intentos en un experimento multinomial resulten en 
(T; = y |. Y 2 = y 2 , ■ ■ ■, Y k = y k ) es una excelente aplicacion de los metodos probabilisticos del 
Capftulo 2. Dejamos este problema como ejercicio. 
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DEFINICION 5.12 


EJEMPLO 5.30 


Solucion 


Suponga qnep v p 2 , ... ,p k son tales que £f =1 p, = 1, y p t > 0 para i = 1, 2, . . ., k. 
Se dice que las variables aleatorias Y v Y 2 , . . . , Y k tienen una distribution multinomial 
con parametros n y p v p 2 , ■ ■ ■, Pk s i l a funcion de probabilidad conjunta de Y v Y 2 ,, 
Y k esta dada por 

p(yu >'2,.■ •, yk) = ——p- t Pi pi 2 ■■■ Pk> 

y\'-yi'- ■■■yk'- 

donde, para cada i, y t = 0, 1, 2,. . ., n y Yi = n - 


Muchos experimentos en los que aparece una clasificacion son multinomiales. Por ejem- 
plo, clasificar personas en cinco grupos resulta en una enumeration o cantidad correspondien- 
te a cada una de cinco clases de ingreso. O bien, podriamos estar interesados en estudiar la 
reaccion de ratones a un estfmulo particular en un experimento psicologico. Si los ratones 
pueden reaccionar en una de tres formas cuando se aplica el estfmulo, el experimento da el 
numero de ratones que caigan en cada clase de reaccion. Del mismo modo, un estudio de tran- 
sito podrfa requerir un conteo y clasificacion de los tipos de vehfculos de motor que usan una 
seccion de carretera. Un proceso industrial podrfa manufacturar artfculos que caigan en una de 
tres clases de calidad: aceptables, de segunda y rechazos. Un estudiante de arte podrfa clasifi¬ 
car pinturas en una de k categorfas de acuerdo con el estilo y periodo, o podriamos clasificar 
ideas filosoficas de los autores en un estudio de literatura. El resultado de una campana publi- 
citaria podrfa dar datos que indiquen una clasificacion de reacciones del consumidor. Muchas 
observaciones de ciencias ffsicas no son sensibles a mediciones en una escala continua y, por 
tanto, resultan en datos enumerativos que corresponden a los numeros de observaciones que 
caen en varias clases. 

Observe que el experimento binomial es un caso especial del experimento multinomial 
(cuando hay k = 2 clases). 


De acuerdo con cifras de un censo reciente, las proporciones de adultos (personas de mas de 
18 anos de edad) en Estados Unidos, asociados con cinco categorfas de edades se dan en la 
siguiente tabla. 


Edad 

Proporcion 

18-24 

.18 

25-34 

.23 

35-44 

.16 

45-64 

.27 

651 

.16 


Si estas cifras son precisas y cinco adultos se muestrean aleatoriamente, encuentre la probabi¬ 
lidad de que la muestra contenga una persona entre las edades de 18 y 24, dos entre 25 y 34, 
y dos entre 45 y 64. 

Vamos a numerar las cinco clases de edad 1, 2, 3, 4 y 5 de arriba abajo y supondremos que 
las proporciones dadas son las probabilidades asociadas con cada una de las clases. Entonces 
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deseamos hallar 


Tl ^ 

/ \ ' yi V2 Y3 yA ys 

p(y\,yi,y3,y4,ys) = — —:—:—:— -p\ p 2 Pi Pi Ps > 

yi'.y 2 \ y 2 \ 34! ys! 

para n = 5 y y l = 1 ,y 2 = 2, _y 3 = 0, y 4 = 2 y v 5 = 0. Sustituyendo estos valores en la formula 
para la funcion de probabilidad conjunta, obtenemos 

d(1, 2, 0, 2, 0) = -—-(. 18) * 1 (.23) 2 (. 16)°(.27) 2 (. 16)° 

^ 1! 2! 0! 2! 0! 

= 30(. 18)(.23) 2 (.27) 2 = .0208. ■ 


TEOREMA 5.13 


Demostracion 


Si Fj, Y 2 , . . . ,Y k tienen una distribucion binomial con parametros y y p v p 2 , . . . , p k , 
entonces 

1. E(Yj ) = npi, V ( Yi) = npiqi. 

2. Cov(F s , Y t ) = — np s p,, sis ¥= t. 


La distribucion marginal de Y t se puede usar para obtener la media y varianza. Recuerde 
que Y i puede ser interpretada como el numero de intentos que caen en la celda i. Imagine 
todas las celdas, excluyendo la combinadas en una sola celda grande. Entonces cada 
intento resultara en la celda i o en una celda que no sea la i, con probabilidades p : y 
1 - p p respectivamente. Entonces, Y t posee una distribucion de probabilidad marginal 
binomial. En consecuencia. 


E(Yi) = npi y V(F,) = npiqt, donde q t = 1 - p,. 


Los mismos resultados se pueden obtener al establecer los valores esperados y evaluar. 
Por ejemplo, 



Como ya hemos deducido el valor esperado y la varianza de Y r dejamos la sumatoria de 
este valor esperado para el lector interesado. 

La demostracion de la parte 2 usa el Teorema 5.12. Considere el experimento multi¬ 
nomial como una sucesion de n intentos independientes y defina, para s ¥= t. 


_ f 1, si el intento i resulta en clase s, 

t/ i j 

[ 0, de otro modo, 

y 

,,, f 1, si el intento i resulta en clase t, 
Wi = 

0, de otro modo. 

Entonces 

n n 

Y s = J^Ui y Y t = J2 w J- 

>=i j =1 
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(Como Uf = 1 o 0 dependiendo de si el t-esimo intento resulto en clase s, Y s es sim- 
plemente la suma de una serie de numeros 0 y 1. Ocurre un 1 en la suma cada vez que 
observemos un artfculo de la clase s y un 0 cada vez que observemos cualquier otra 
clase. Entonces, Y s es simplemente el numero de veces que se observe la clase .v. Una 
interpretacion similar se aplica a Y t .) 

Observe que U i y W t no pueden ser iguales a 1 (el f-esimo artfculo no puede estar 
simultaneamente en las clases s y r). Entonces, el producto siempre es igual a cero 
y EiUjWj) = 0. Los siguientes resultados nos permiten evaluar Cov(F v , Y t ): 

Em = Ps 

E(Wj) = Pt 

Co\(U,. Wj) =0, si i j porque los intentos son independientes 
Co v(Ui, W t ) = E(UiWi) - E(Ui)E(Wi ) = 0 - p s p, 

Del Teorema 5.12 tenemos entonces 


Cov(Y s , Y t ) = EE Cov(f/,, Wj) 

i =1 j = 1 

n 

= J]Cov(t/„ W,) + J2Y, Cov(Ui ’ Wj) 
i =1 i*j 

n 

= YJL-PsP,) + EE° = -np s Pf 

i=l i^j 

La covarianza es negativa, lo que ya se esperaba, porque un gran numero de resultados 
en la celda s forzarfa al numero de la celda t a ser pequeno. 


Los problemas inferenciales asociados con el experimento multinomial se analizaran mas 
adelante. 


Ejercicios 

5.119 Un experimento de aprendizaje requiere que una rata corra por un laberinto (una red de pasillos) hasta 
que localice una de tres posibles salidas. La salida 1 presenta una recompensa de alimento, no asf las 
salidas 2 y 3. (Si la rata finalmente selecciona la salida 1 casi siempre, puede tener lugar el aprendizaje.) 
Denote con Y t el numero de veces que la salida i es seleccionada en corridas sucesivas. Para lo siguiente, 
suponga que la rata escoge una salida aleatoriamente en cada corrida. 

a Encuentre la probabilidad de que n = 6 corridas resulte en Jj = 3, Y 2 = 1 y Y 3 = 2. 
b Para n general, encuentre E^Y^ y ViY^. 
c Encuentre Cov(F 2 , F 3 ) para n general. 

d Para comprobar la preferencia de la rata entre las salidas 2 y 3, podemos buscar en Y 2 - Y 3 . Encuentre 
E(Y 2 - F 3 ) y V{Y n - F 3 ) para n general. 

5.120 Una muestra de tamano n se selecciona de un gran lote de artfculos en los que una proporcion /q con- 
tiene exactamente un defecto y una proporcion p 2 contiene mas de un defecto (con + p-, < 1). El 
costo de reparar los artfculos defectuosos de la muestra es C =Fj + 3F 2 , donde F 3 denota el numero 
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de artfculos con un defecto y Y 2 denota el numero con dos o mas defectos. Encuentre el valor esperado 
y la varianza de C. 

5.121 Consulte el Ejercicio 5.117. Suponga que el numero N de lagartos de la poblacion es muy grande, con 
Pi = -3y Pi = 1. 

a Encuentre la probabilidad de que, en una muestra de cinco lagartos, Y l — 2 y Y 2 = 1. 

(Yi Y 2 \ (Yi Y 2 

b Si n = 5, encuentre El— — — )y VI-— 

\ n n J \ n n 

5.122 Los pesos de una poblacion de ratones alimentada con cierta dieta desde su nacimiento se supone que 
estan normalmente distribuidos con /x = 100 y cr = 20 (mediciones en gramos). Suponga que una mues¬ 
tra aleatoria de n = 4 ratones se toma de esta poblacion. Encuentre la probabilidad de que 

a exactamente dos ratones pesen entre 80 y 100 gramos y exactamente uno de ellos pese mas de 100 
gramos, 

b los cuatro ratones pesen mas de 100 gramos. 

5.123 El National Fire Incident Reporting Service informo que, de los incendios residenciales, 73% son en 
casas familiares, 20% en departamentos y 7% en otros tipos de viviendas. Si se informa de cuatro incen¬ 
dios residenciales en un solo dfa, ^cual es la probabilidad de que dos sean en casas familiares, uno sea 
en un departamento y uno en otro tipo de vivienda? 

5.124 El costo tlpico de danos causados por un incendio en una casa familiar es de $20,000. Los costos compa¬ 
rables de un incendio en un departamento y en otros tipos de vivienda son $10,000 y $2000, respectiva- 
mente. Si cuatro incendios se reportan de manera independiente, use la information del Ejercicio 5.123 
para hallar 

a el costo total esperado de danos, 
b la varianza del costo total de danos. 

5.125 Cuando se inspeccionan aviones comerciales, las grietas en alas se reportan como no existentes, detecta- 
bles o crfticas. La historia de una flota particular indica que 70% de los aviones inspeccionados no tienen 
grietas en las alas, 25% tienen grietas detectables en las alas y 5% tienen grietas crfticas en las alas. Se 
seleccionan aleatoriamente cinco aviones. Encuentre la probabilidad de que 

a uno tenga una grieta crftica, dos tengan grietas detectables y dos no tengan grietas, 
b al menos un avion tenga grietas crfticas. 

5.126 Un lote grande de artfculos manufacturados contiene 10% con exactamente un defecto, 5% con mas 
de un defecto y el resto sin defectos. Diez artfculos se seleccionan aleatoriamente de entre este lote para 
su venta. Si Fj denota el numero de artfculos con un defecto y F 2 el numero con mas de un defecto, los 
costos de reparation son Fj + 3F 2 . Encuentre la media y la varianza de los costos de reparation. 

5.127 Consulte el Ejercicio 5.126. Denote con F el numero de artfculos de entre los diez que contienen al 
menos un defecto. Encuentre la probabilidad de que F 

a sea igual a 2, 
b sea al menos 1. 


5.10 Distribucion normal 
bivariante (opcional) 


Ningun analisis de distribuciones de probabilidad multivariante estarfa completo sin una re- 
ferencia a la distribution normal multivariante, que es la piedra angular de mucha de la teorfa 
moderna de estadfstica. En general, la funcion de densidad normal multivariante se define para 
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k variables aleatorias continuas, Y v Y 2 ,. . ., Y k . Debido a su complejidad, presentaremos solo 
la funcion de densidad bivariante (k = 2): 


f(yu yi) = 


,- 2/2 


2ttct\ a? y/\ — p 2 


-oo < yi < oo, —oo < y 2 < oo, 


donde 


Q = 


1 ~ p 2 


(yi - im ) 2 . (yi ~/d)(F 2 -/J-2) . (j2 

- 2 - - + - 2 - 

O', O'! 02 cr, 


La funcion de densidad normal bivariante es una funcion de cinco parametros: p v p 2 , 
cr\, (t\ y p. La election de la notation empleada para estos parametros no es casual. En el 
Ejercicio 5.128, usted demostrara que las distribuciones marginales de F, y Y 2 son normales 
con medias p x y p 2 y varianzas cr\ y a 2 , respectivamente. Con un poco de integracion un tanto 
tediosa, podemos demostrar que Cov( K,, Y 2 ) = fi<r^r 2 . 

Si Cov(L[, Y 2 ) = 0, o bien, lo que es equivalente, si p = 0, entonces 


f(yu yi) = g(yi)h(y 2 ), 


donde gly,) es una funcion no negativa solo de y, y h(yp es una funcion no negativa solo de 
y 2 . Por tanto, si p = 0, el Teorema 5.5 implica que K, y Y 2 son independientes. Recuerde que 
cero covarianza para dos variables aleatorias por lo general no implica independencia. No 
obstante, si Y^ y Y 2 tienen una distribucion normal bivariante, son independientes si y solo si 
su covarianza es cero. 

La expresion para la funcion de densidad conjunta, k > 2, se expresa con mas facilidad 
usando algebra de matrices. Un analisis del caso general se puede hallar en la bibliografia 
citada al final de este capftulo. 


Ejercicios 

*5.128 Considere que Lj y Y 2 tienen una distribucion normal bivariante. 

a Demuestre que la distribucion marginal de Fj es normal con media p 1 y varianza crj 2 . 
b ^Cual es la distribucion marginal de F,? 

*5.129 Considere que Y 1 y F, tienen una distribucion normal bivariante. Demuestre que la distribucion condicional 

de Fj dado que F 2 = y 2 es normal con media pi + p —(y 2 — pi) y varianza o-j 2 (l — p 2 ). 

02 

*5.130 Sean Y l , F 2 ,.. ., F„ variables aleatorias independientes con E(Y^) = p y V{Y^) = a 2 para i — 1, 2,..., n. 
Sean 

n n 

=2>r i y u 2 = £>f„ 

i=l i=l 

donde a x , a 2 , . . . , a n y b x , b 2 , . . . , b n son constantes. Se dice que U x y U 2 son ortogonales si Co w(U l , 
U 2 ) = 0. 

a Demuestre que U x y U 2 son ortogonales si y solo si 1 a <bi — 0. 

b Suponga, ademas, que Y x , Y 2 ,. . . ,Y n tienen una distribucion normal multivariante. Entonces U x y U 2 
tienen una distribucion normal bivariante. Demuestre que U x y U 2 son independientes si son ortogo¬ 
nales. 










5.11 Valores esperados condicionales 285 


* 5.131 


* 5.132 


5.11 


DEFINICION 5.13 


EJEMPLO 5.31 


Solucion 


Sean F, y Y 2 variables aleatorias independientes normalmente distribuidas con medias /Ltj y p 2 , respecti- 
vamente y varianzas of = a 2 = a 2 . 

a Demuestre que Fj y Y 2 tienen distribucion normal bivariante con p = 0. 

b Considere U 1 = Fj + F, y U 2 = Y { - Y-,. Use el resultado del Ejercicio 5.130 para demostrar que 
U l y U 2 tienen una distribucion normal bivariante y que U l y U 2 son independientes. 

Consulte el Ejercicio 5.131. ^Cuales son las distribuciones marginales de U l y t/ 2 ? 


Valores esperados condicionales 

La Seccion 5.3 contiene un examen de funciones de probabilidad condicional y funciones de 
densidad condicional que ahora relacionaremos con valores esperados condicionales. Estos se 
definen en la misma forma que los valores esperados univariantes, excepto que las densidades 
condicionales y las funciones de probabilidad se usan en lugar de sus similares marginales. 


Si F[ y Y 2 son dos variables aleatorias cualesquiera, el valor esperado condicional de 
g(Fj), dado que Y 2 = y 2 , se define que es 

/ OO 

g(yi)f(yi I yi)dy x 

-oo 

si Y l y Y 2 son continuas conjuntamente y 

E(g(Y\) | y 2 = y 2 ) = g(y\)p(yi | yi) 

toda yi 

si Fj y Y 2 son discretas conjuntamente. 


Consulte las variables aleatorias F, y Y 2 del Ejemplo 5.8, donde la funcion de densidad con- 
junta esta dada por 

f 1/2, 0 < y, < y 2 s 2, 
f(yi,y 2 ) = \ 

[ 0, en cualquter otro punto. 

Encuentre el valor esperado condicional de la cantidad de ventas, F h dado que Y 2 = 1.5. 


En el Ejemplo 5.8 determinamos que si 0 < y 2 < 2, 


i ^ f VF2, 0 < Ft — yii 
/(Ft I F 2 ) = ■! 

[ 0, en cualquter otro punto. 


Asi, de acuerdo con la definicion 5.13, para cualquier valor de y 2 tal que 0 < f 2 ^ 2, 


E(Y\ | Y 2 = y 2 ) 


Ft/(Ft I yi)dyi 


C 
f-(j) 


rj! / 1 \ 1 

yi (-) rfyt = - 



F2 

2 ' 
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En vista de que estamos interesados en el valor y 2 = 1.5, se deduce que E( Y ] \ Y 2 = 1.5) = 
1.5/2 = 0.75. Esto es, si la maquina automatica expendedora de bebidas contiene 1.5 galones 
al principio del dfa, la cantidad esperada por venderse ese dfa es 0.75 galones. ■ 


En general, el valor esperado condicional de Y 1 dada Y 2 = y 2 es una funcion de y 2 . Si ahora 
hacemos variar Y 2 en todos sus posibles valores, podemos considerar el valor esperado con¬ 
dicional £■(11%) como una funcion de la variable aleatoria Y 2 . En el Ejemplo 5.31 obtuvimos 
E(Y l \Y 2 = y 2 ) = y 2 / 2. Se deduce que E(Y t \ Y 2 ) = Y 2 /2. Como E{Y t \Y 2 ) es una funcion de la 
variable aleatoria Y 2 , tambien es una variable aleatoria; y como tal, tiene media y varian- 
za. Consideramos la media de esta variable aleatoria en el Teorema 5.14 y la varianza en el 
Teorema 5.15. 


TEOREMA 5.14 


Demostracion 


Si Y l y Y 2 son dos variables aleatorias, entonces 

E(Y l ) = E[E(Y\ | Y 2 )], 

donde en el lado derecho de la ecuacion el valor esperado interior es con respecto a 
la distribucion condicional de K [ dada Y 2 y el valor esperado exterior es con respecto 
a la distribucion de Y 2 . 

Suponga que Y l y Y 2 son continuas conjuntamente con funcion de densidad conjunta 
f(y v y 2 ) y densidades marginales/jijq) yf 2 (y 2 ), respectivamente. Entonces 


E{Y X ) = 


>’i/(>’i. >’ 2 ) <7>’i dy 2 


/ OO /*C 

-00 J — 00 

/ oo /*oo 

/ Ti f(y\ I yi)hiyi) dy t dy 2 
-00 J — 00 

/ oo r />o 

00 [J— c 


hiyi) dy 2 


yifiyi I y2)dy x 

) J 

/ oo 

E(Y\ | Y 2 = y 2 )f 2 (y 2 ) dy 2 = E [E(Y\ \ Y 2 )]. 

-00 

La demostracion es semejante para el caso discreto. 


EJEMPLO 5.32 Un programa de control de calidad para una linea de ensamble comprende el muestreo de n 
= 10 articulos terminados por dfa y contar el numero de artfculos defectuosos, Y. Si p denota 
la probabilidad de observar uno defectuoso, entonces Y tiene una distribucion binomial, su- 
poniendo que un numero grande de artfculos son producidos por la lfnea. Pero p varfa diaria- 
mente y se supone que tiene una distribucion uniforme en el intervalo de 0 a 1/4. Encuentre 
el valor esperado de Y. 


Solucion Del Teorema 5.14 sabemos que E(Y) = E[E(Y\p)]. Para una p dada, Y tiene una distribucion 
binomial, de ahf que E( Y\p) = up. Por tanto, 

E{Y) = E[E(Y\p)] = E(np) = nE(p) = n = ”, 
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TEOREMA 5.15 


Demostracion 


y para n = 10 


E(Y) = 10/8 = 1.25. 

A la larga, esta polltica de inspection va a promediar 1.25 artfculos defectuosos por dla. ■ 


La varianza conditional de dada Y 2 = y 2 esta definida por analogfa con una varianza 
ordinaria, de nuevo utilizando la densidad conditional o funcion de probabilidad de Y x dada Y 2 
= y 2 en lugar de la densidad ordinaria o funcion de probabilidad de Y v Esto es, 

V(Y, | Y 2 = y 2 ) = E(Y1 1 Y 2 = y 2 ) - [E(Y, | L 2 = y 2 )] 2 . 

Como en el caso de la media condicional, la varianza conditional es una funcion de y 2 . Si 
dejamos que Y 2 tome todos sus valores posibles, podemos definir VIT, Y 2 ) como una variable 
aleatoria que es una funcion de Y 2 . Espetificamente, si g(v 9 ) = V( Y^ \ Y 2 = y 2 ) es una funcion 
particular del valor observado y 2 , entonces g(Y 2 ) = V( Y j \ Y 2 ) es la misma funcion de la variable 
aleatoria, Y 2 . El valor esperado de V( Y ] \ Y n ) es util para calcular la varianza de Y u como se 
detalla en el Teorema 5.15. 


Si Y 1 y Y 2 representan variables aleatorias, entonces 

V(Y\) = E[V(Y X | Y 2 )] + V[E(Y\ | Y 2 )\ 

Como se indico antes, V( K, | Y 2 ) esta dada por 

V(Yi | Y 2 ) = £(}f | Y 2 ) - [EiYi | E 2 )] 2 

y 

E[V(Y X | Y 2 )] = £[£(>", 2 | Y 2 )] - E{[E{Y X \ E 2 )] 2 }. 

Por definition, 

V[E{Y X \Y 2 )} = E\[E{Y x \Y 2 )f\- [E[E(Y X \Y 2 )]) 2 . 

La varianza de K, es 

V(Y,) = E[Yf] - [£(L!)] 2 

= £{£[L 1 2 |L 2 ]}-{£[£(L 1 |L 2 )]} 2 

= e{e[yI\y 2 ]} -e{[e(l i |l 2 )] 2 } +e{[e(Li |l 2 )] 2 } 

-{E[E{Y X \Y 2 )]} 2 
= E[V(Y l | Y 2 )] + V[E(Y\ | Y 2 )\ 
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EJEMPLO 5.33 

Solucion 


Consulte el Ejemplo 5.32. Encuentre la varianza de Y. 
Del Teorema 5.15 sabemos que 


V(Fi) = E[V(Y { | Y 2 )] + V[E(Y\ | Y 2 )\ 


Para una p dada, Y tiene una distribucion binomial, y en consecuencia E(Y\p) = np y V(Y\p) 
= npq. Por tanto, 

V(Y) = E[V(Y\p)] + V[E(Y\p)] 

= E(npq ) + V(np) = nE [p{ 1 — p)] + n 2 V{p). 

Como p esta uniformemente distribuida en el intervalo (0, 1 /4) y E(p 2 ) = V(p) + [E(p)] 2 , se 
deduce que 


E{p) = l, V(p) = 


(1/4 — 0) 2 
12 


1 

192’ 


1 


1 


1 


E(p 2 ) = - + — = 

y 192 64 48 


Asf que. 


V(Y) = nE[p{ 1 - p)] +n 2 V(p ) = n [E(p) - E(p 2 )] +n 2 V(p ) 

1 


n | - — — 1 + 
.8 48 


192 


5 n n 2 

~ 48 + 192’ 


y para n = 10, 


V(Y ) = 50/48 + 100/192 = 1.5625. 


Por tanto, la desviacion estandar de Y es cr = V l .5625 = 1.25. 


La media y varianza de Y calculada en los Ejemplos 5.32 y 5.33 podrlan comprobarse de- 
terminando la funcion de probabilidad incondicional de Y y calcular E{ Y) y V(Y) directamente. 
Para hacerlo, necesitarfamos hallar la distribucion conjunta de Y y p. De esta distribucion con- 
junta se puede obtener la funcion de probabilidad marginal de Y y determinar E(Y) al evaluar 
J2 y yp(y)- La varianza se puede determinar en la forma usual, de nuevo usando la funcion de 
probabilidad marginal de Y. En los Ejemplos 5.32 y 5.33, evitamos trabajar directamente con 
las distribuciones conjunta y marginal. Los Teoremas 5.14 y 5.15 nos permitieron un calculo 
mucho mas rapido de la media y la varianza deseadas. Como siempre, la media y la varianza 
de una variable aleatoria pueden combinarse con el teorema de Tchebysheff para obtener 
llmites para probabilidades, cuando la distribucion de la variable sea desconocida o diflcil de 
deducir. 

En los Ejemplos 5.32 y 5.33 encontramos una situacion en la que la distribucion de una 
variable aleatoria (Y = el numero de artfculos defectuosos) se dio condicionalmente para po- 
sibles valores de una cantidad p que podrfa variar de un dfa a otro. El hecho de que p variara se 
tomo en cuenta al asignar una distribucion de probabilidad a esta variable. Este es un ejemplo 
de un modelo jerarquico. En estos modelos la distribucion de una variable de interes, por 
ejemplo, Y, esta condicionada al valor de un “parametro” 0. La incertidumbre alrededor del 
valor real de 9 se modela al asignarle una distribucion de probabilidad. Una vez que especifi- 
camos la distribucion condicional de Y dada 9 y la distribucion marginal de 9 , la distribucion 
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conjunta de Y y 6 se obtiene al multiplicar la condicional por la marginal. La distribution mar¬ 
ginal de Y se obtiene entonces de la distribucion conjunta mediante una integracion o suma que 
incluya los posibles valores de 6. Los resultados de esta seccion se pueden usar para encontrar 
E( Y) y V( Y) sin que sea necesario determinar esta distribucion marginal. Otros ejemplos de 
modelos jerarquicos estan contenidos en los Ejercicios 5.136, 5.138, 5.141 y 5.142. 


Ejercicios 

5.1 33 En el Ejercicio 5.9 determinamos que 

f 6(1 - y 2 ), 0 < yi < y 2 £ 1, 

f(yu >’ 2 ) = \ n 

I 0, en cualquier otro punto 

es una funcion de densidad de probabilidad conjunta valida. 
a Encuentre E{Yi\Y 2 = y 2 ). 

b Use la respuesta que obtuvo en el inciso a para hallar E(Y{). (Compare esto con la respuesta hallada 
en el Ejercicio 5.77.) 

5.134 En los Ejemplos 5.32 y 5.33 determinamos que si Y es el numero de artfculos defectuosos, E(Y) = 1.25 
y V(Y) = 1.5625. ^.Es probable que, en cualquier dfa determinado, Y sea mayor que 6? 

5.135 En el Ejercicio 5.41 consideramos un programa de control de calidad que exige seleccionar en forma 
aleatoria ties artfculos de entre la production diaria (que se supone es grande) de cierta maquina y ob- 
servar el numero de artfculos defectuosos. La proportion p de artfculos defectuosos producidos por la 
maquina varfa diariamente y tiene una distribucion uniforme en el intervalo (0, 1). Encuentre 

a el numero esperado de artfculos defectuosos observado entre los tres artfculos muestreados. 
b la varianza del numero de artfculos defectuosos de entre los tres muestreados. 

5.136 En el Ejercicio 5.42 se supo que el numero de defectos por yarda en cierta tela, Y, tenfa una distribucion 
de Poisson con parametro A. Se supuso que el parametro A era una variable aleatoria con funcion de 
densidad dada por 

A >0, 

en cualquier otro punto. 

a Encuentre el numero esperado de defectos por yarda hallando primero el valor condicional de Y para 
una A dada. 

b Encuentre la varianza de Y. 
c ^Es probable que Y exceda de 9? 

5.137 En el Ejercicio 5.38 supusimos que fj, el peso de un artfculo a granel abastecido por un proveedor, tenfa 
una distribucion uniforme en el intervalo (0, 1). La variable aleatoria Y 2 denotaba el peso del artfculo 
vendido y se suponfa que tenfa una distribucion uniforme en el intervalo (0, >’,), donde y, era un valor 
especffico de Pj. Si el proveedor abastecio 3/4 de tonelada, ^que cantidad podrfa esperar vender durante 
la semana? 

5.138 Suponga que Y denota el numero de bacterias por centfmetro cubico en un lfquido particular y que Y 
tiene una distribucion de Poisson con parametro A. Tambien suponga que A varfa de un lugar a otro 
y tiene una distribucion gamma con parametros a y (3, donde a es un entero positivo. Si aleatoriamente 
seleccionamos un lugar, ^cual es 
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a el numero esperado de bacterias por centfmetro cubico?, 
b la desviacion estandar del numero de bacterias por centfmetro cubico? 

5.139 Suponga que una companfa ha determinado que el numero de trabajos por semana, N, varfa de una se- 
mana a otra y tiene una distribution de Poisson con media A. El numero de horas para completar cada 
trabajo, Y t , es una distribution gamma con parametros a y /3. El tiempo total para completar todos los 
trabajos en una semana es T = Observe que T es la suma de un numero aleatorio de variables 

aleatorias. ^,Cual es 

a E(T\N = n)l, 

b E(T), el tiempo total esperado para completar todos los trabajos? 


5.140 

5.141 


i Por que es E[V(Fi|F 2 )] < V(Fj)? 


Sea Pj que tiene una distribution exponential con media A y la densidad conditional de Y 2 dado que 

y, = >'| es 


f(yi I Ft) 


1/yi, 0<y 2 ^yi, 

0, en cualquier otro punto. 


Encuentre E(Y 2 ) y V(Y 2 ), la media y la varianza incondicional de F 2 . 

5.142 Suponga que F tiene una distribution binomial con parametros n y p pero que p varfa de un dfa a otro de 
acuerdo con una distribution beta con parametros a y p. Demuestre que 

a E{Y) =na/(a+P). 

, naB (a+ B + n) 

(a + P ) 2 (a +P + 1) 

*5.143 Si Fj y F 2 son variables aleatorias independientes, cada una teniendo una distribution normal con media 
0 y varianza 1, encuentre la funcion generadora de momento de U = FjF 2 . Use esta funcion generadora 
de momento para hallar E(U) y V(U). Compruebe el resultado al evaluar E(U) y V(U) directamente de 
las funciones de densidad para Fj y F 2 . 


5.12 Resumen 

El experimento multinomial (Section 5.9) y su distribution de probabilidad multinomial aso- 
ciada constituyen el tema de este capftulo. Casi todos los experimentos dan mediciones de 
muestra, y x , y 2 ,. ■ ■, y k , que pueden ser considerados como observaciones de k variables alea¬ 
torias. Las inferencias relacionadas con la estructura que generan las observaciones, es decir, 
las probabilidades de caer en las celdas 1 , 2 ,..., k, estan basadas en el conocimiento de las 
probabilidades asociadas con diversas muestras ( v ,, y 2 , . . . , y k ). Las distribuciones conjunta, 
marginal y conditional son conceptos esenciales para determinar las probabilidades de varios 
resultados muestrales. 

Generalmente tomamos una muestra de n observaciones de una poblacion, que son valores 
especfficos de F h F 2 , . . ., Y n . Muchas veces las variables aleatorias son independientes y tie- 
nen la misma distribution de probabilidad. En consecuencia, el concepto de independencia es 
util para calcular la probabilidad de observar la muestra dada. 

El objetivo de este capftulo fue expresar las ideas contenidas en los dos parrafos anterio- 
res. La gran cantidad de detalles contenidos en el capftulo son esenciales para dar un solido 
respaldo para un estudio de inferencia. Al mismo tiempo, el lector debe tener el cuidado de 
evitar dar demasiada importancia a los detalles; asegurese de tener en mente la amplitud de los 
objetivos de la inferencia. 
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Ejercicios complementarios 

5.144 Demuestre el Teorema 5.9 cuando Y 1 y Y 2 son variables aleatorias discretas independientes. 

5.145 Un tecnico empieza un trabajo en el tiempo F, que esta uniformemente distribuido entre las 8:00 a.m. 
y las 8:15 a.m. El tiempo para completar el trabajo, Y 2 , es una variable aleatoria independiente que esta 
uniformemente distribuida entre 20 y 30 minutos. ^Cual es la probabilidad de que el trabajo se complete 
antes de las 8:30 a.m.? 

5.146 El objetivo de una bomba esta en el centro de un circulo con radio de 1 milla. La bomba cae en un punto se- 
leccionado aleatoriamente dentro de ese circulo. Si la bomba destruye todo dentro de 1 /2 milla de su pun¬ 
to de caida, ^cual es la probabilidad de que el objetivo sea destruido? 

5.147 Dos amigos se han de encontrar en la biblioteca. Cada uno de ellos, en forma independiente y aleatoria, 
selecciona una hora de llegada dentro del mismo periodo de una hora y conviene en esperar diez minutos 
al otro hasta que llegue. ^Cual es la probabilidad de que se encuentren? 

5.148 Una comision de tres personas va a ser seleccionada aleatoriamente de entre un grupo que contiene cua- 
tro republicanos, tres democratas y dos independientes. Denote con Y 1 y Y , los numeros de republicanos 
y democratas, respectivamente, en la comision. 

a ^Cual es la distribution de probabilidad conjunta para Fj y F 2 ? 

b Encuentre las distribuciones marginales de Y j y Y 2 . 

c Encuentre P(Y l = 1|F 2 > U- 

5.149 Tengan fj y Y 2 una funcion de densidad conjunta dada por 


[ 3yi, 0<y 2 <y!<l, 

f(yu yi) = | 

[ 0, en cualquier otro punto. 

a Encuentre las funciones de densidad marginal de Fj y F 2 . 
b Encuentre P(Y 1 < 3/4|F 2 < 1 /2). 

c Encuentre la funcion de densidad condicional de Fj dado que F 2 = y 2 . 
d Encuentre P(Y ] < 3/4|F 2 = 1 /2). 
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5.150 


5.151 


5.152 


5.153 


5.154 


Consulte el Ejercicio 5.149. 

a Encuentre £(7 2 | 7] = jq). 

b Use el Teorema 5.14 para hallar £(7,). 

c Encuentre E( 7 2 ) directamente de la densidad marginal de 7 2 . 

La vida util Y para un tipo de fusible tiene una distribucion exponencial con una funcion de densidad 
dada por 


fd/ys )e~y», »>o, 

f(y) = 

[ 0, en cualquier otro punto. 


a Si dos de estos fusibles tienen vidas independientes 7j y Y 2 , encuentre su funcion de densidad de 
probabilidad conjunta. 

b Uno de los fusibles del inciso a esta en un sistema primario y el otro esta en el sistema de respaldo 
que entra en servicio solo si falla el sistema primario. Por tanto, la vida util total efectiva de los dos 
fusibles es 7j + Y Encuentre P(Y l + 7 2 < a), donde a > 0. 

En la production de cierto tipo de cobre, dos tipos de polvo de cobre (A y B) se mezclan y se sinte- 
rizan (calientan) durante cierto tiempo. Para un volumen fijo de cobre sinterizado, el productor mide 
la proportion Y l del volumen debido al cobre solido (algunos poros tendran que llenarse de aire) y la 
proportion Y 2 de la masa solida debida a cristales tipo A. Suponga que las densidades de probabilidad 
apropiadas para 7j y Y 2 son 


fi(yi) 


fiiyi) 


6yi(l - yi), 0 < yi < 1, 

0, en cualquier otro punto, 

3yf, o < >'2 =£ I, 

0, en cualquier otro punto. 


La proportion del volumen muestral debida a cristales tipo A es entonces 7, Y 2 . Suponiendo que Y { y Y 2 
sean independientes, encuentre P(Y X Y 2 £ .5). 

Suponga que el numero de huevos puestos por cierto insecto tiene una distribucion de Poisson con media 
A. La probabilidad de que cualquier huevo incube es p. Suponga que los huevos se incuban de manera 
independiente unos de otros. Encuentre 

a el valor esperado de 7, el numero total de huevos que incuban, 
b la varianza de 7. 

En un estudio clfnico de un nuevo medicamento formulado para reducir los efectos de la artritis reuma- 
toide los investigadores encontraron que la proportion p de pacientes que responden de manera favo¬ 
rable al medicamento es una variable aleatoria que varfa con cada lote del medicamento. Suponga que 
p tiene una funcion de densidad de probabilidad dada por 


Ap) 


12/r(l - p), 0 < p < 1, 

0, en cualquier otro punto. 


Suponga que a n pacientes se les inyectan porciones del medicamento tomadas del mismo lote. Denote 
con 7 el numero que muestre una respuesta favorable. 

a Encuentre la distribucion de probabilidad incondicional de 7 para n general, 
b Calcule E(Y) para n = 2. 
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5.155 


5.156 


5.157 


5.158 


* 5.159 


5.160 


5.161 


Suponga que Y v Y 2 y F 3 son variables aleatorias independientes con distribucion % 2 , con iq, v 2 y v 3 gra- 
dos de libertad respectivamente y que W 1 = Y l + Y 2 y W 2 = F 3 + F 3 . 

a En el Ejercicio 5.87, usted obtuvo la media y varianza de W l . Encuentre Cov(lVj, VF,). 
b Explique por que esperaba que la respuesta al inciso a fuera positiva. 

Consulte el Ejercicio 5.86. Suponga que Z es una variable aleatoria normal estandar y que Y es una 
variable aleatoria independiente con distribucion % 2 y v grados de libertad. 

a Defina W = Z/\lY ■ Encuentre Cov(Z, W). ^Que suposicion necesita acerca del valor de vl 
b Con Z,YyW como se indica lfneas antes, encuentre Cov(F, W). 

c Una de las covarianzas de los incisos a y b es positiva, y la otra es cero. Explique por que. 

Un guardabosques que estudia pinos enfermos representa el numero de arboles enfermos por acre, F, 
como una variable aleatoria de Poisson con media A. No obstante, A cambia de una zona a otra y su 
comportamiento aleatorio es modelado por una distribucion gamma. Esto es, para algun entero a. 


/(A) 


-A“- 1 e -V0 A >0, 

. r(a)/3“ 

0, en cualquier otro punto. 


Encuentre la distribucion de probabilidad incondicional para F. 

Una moneda tiene probabilidad p de caer de cara hacia arriba cuando se lanza al aire. En n lanzamientos 
independientes, A, = 1 si el i-esimo tiro resuita cara yl ; = 0 si el i-esimo tiro resulta cruz. Entonces F, 
el numero de caras en los n lanzamientos, tiene una distribucion binomial y puede representarse como 
F = J2"=] Encuentre E(Y) y V(Y) usando el Teorema 5.12. 

La variable aleatoria binomial negativa F se definio en la Section 3.6 como el numero del intento en el 
que ocurre el r-esimo exito, en una sucesion de intentos independientes con probabilidad constante p de 
exito en cada intento. Denote con Aj una variable aleatoria definida como el numero del intento en el que 
ocurre el i-esimo exito, para i = 1,2 ,,r. Ahora defina 


Wj — Xi — Xj-u i =1,2,..., r. 


donde a X 0 se le asigna un valor de cero. Entonces puede escribir F = Xa=i Observe que las varia¬ 
bles aleatorias W v W 2 , ■ ■ ■ , W r tienen distribuciones geometricas identicas y son mutuamente indepen¬ 
dientes. Aplique el Teorema 5.12 para demostrar que E(Y) = r/py V(F)= r{ 1 —p)/p 2 . 

Una caja contiene cuatro pelotas, numeradas del 1 al 4. Una de ellas se selecciona aleatoriamente de la 
caja. Sean 


Aj = 1 si se saca la pelota 1 o la pelota 2, 

Xi — 1 si se saca la pelota 1 o la pelota 3, 

X 3 = 1 si se saca la pelota 1 o la pelota 4. 

En cualquier otro caso X i es igual a cero. Demuestre que dos variables aleatorias cualesquiera Aj, X 2 y 

X 3 son independientes mientras que las tres juntas no lo son. 

Suponga que debemos observar dos muestras aleatorias independientes: Fj, F 2 ,..., Y n denota una mues- 
tra aleatoria de una distribucion normal con media /u, j y varianza cr 2 ; y Aj, A 2 ,... ,X n denota una muestra 
aleatoria de otra distribucion normal con media p,-, y varianza cr|. Una aproximacion para p t - p 2 esta 
dada por F — A, la diferencia entre las medias muestrales. Encuentre E(Y — A) y V(F — A). 
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5.162 


* 5.163 


* 5.164 


* 5.165 


* 5.166 


En el Ejercicio 5.65 usted determino que para -1 < a ^ 1, la funcion de densidad de probabilidad de 
{Y v F,) esta dada por 

[ [1 -tr{(l — 2e~ n )( 1 -2* _w )}]e _w_ », 0<yi, 0<y 2 , 

/( yi,yi) = \ 

I 0, en cualquier otro punto, 

y es tal que las distribuciones marginales de Fj y F 2 son exponenciales con media de 1. Tambien demos- 
tro que Y l y Y 2 son independientes si y solo si a = 0. Proporcione dos densidades conjuntas especfficas y 
diferentes que produzcan densidades marginales para Fj y Y 2 que sean exponenciales con media de 1. 

Consulte el Ejercicio 5.66. Si Fjfyj) y F-,(y 2 ) son dos funciones de distribucion, entonces para cualquier 
a, -1 £ a £ 1 , 


F{y 1 , y 2 ) = F 1 (y 1 )F 2 (y 2 )[l - «{1 - F,( yi )}{l - F 2 (y 2 )}] 

es una funcion de distribucion conjunta tal que fj y Y 2 tienen funciones de distribucion marginal F t (yj) 

y F 2 (y 2 ), respectivamente. 

a Si F^y,) y F 2 (y 2 ) son funciones de distribucion asociadas con variables aleatorias exponencialmente 
distribuidas con media de 1, demuestre que la funcion de densidad conjunta de fj y F, es la propor- 
cionada en el Ejercicio 5.162. 

b Si Fj(yj) y F 2 (yf) son funciones de distribucion asociadas con variables aleatorias uniformes (0, 1), 
para cualquier a ,-1 < a < 1, evalue F(y v y 2 ). 

c Encuentre las funciones de densidad conjunta asociadas con las funciones de distribucion que encon- 
tro en el inciso b. 

d Obtenga dos densidades conjuntas especfficas y diferentes tales que las distribuciones marginales de 
Y l y F, sean uniformes en el intervalo (0, 1). 

Sean X t , X 2 y X 3 variables aleatorias, ya sea continuas o discretas. La funcion generadora de momentos 

conjunta de X 2 y X 3 esta definida por 


m(t u t 2 , t 3 ) = E(e' lXl+,2X2+ ' iX3 ). 


a Demuestre que m(t, t, t) representa la funcion generadora de momentos de X l + X-, + X v 
b Demuestre que m(t, t, 0) representa la funcion generadora de momentos de X t + X 2 . 
c Demuestre que 


dh+h+h m ( tu t2i 
dt^dt^dt* 3 


= e(x . 

<l='2=t3=0 


Sean X-, y X 3 que tienen distribucion multinomial con funcion de probabilidad 

n ! n 

p(xu x 2 , x 3 ) = Y^ Xi = ”■ 

X] lx 2 IX 3 . -j 

Use los resultados del Ejercicio 5.164 para responder lo siguiente: 
a Encuentre la funcion generadora de momentos conjunta de Xj, X 2 y X 3 . 

b Utilice la respuesta al inciso a para demostrar que la distribucion marginal de Xj es binomial con 
parametro p v 

c Utilice la funcion generadora de momentos conjunta para hallar Cov(Xj, X 2 ). 

Una caja contiene N 2 bolas blancas, N 2 bolas negras y N 3 bolas rojas (N l + N 2 + N 3 = A0. Se toma de 
la caja una muestra aleatoria de n bolas (sin restitucion). Si Y v F, y F 3 representan el numero de bolas 
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blancas, negras y rojas observadas en la muestra, respectivamente, determine el coeficiente de correla- 
cion para Fj y F,. (Seap ; = NJN, para i = 1, 2, 3.) 

*5.167 Sean Y 1 y Y 2 variables aleatorias distribuidas conjuntamente con varianzas finitas. 

a Demuestre que [£ , (F 1 F 2 )] 2 £ E(Y\)E(Y\). [Sugerencia: observe que E[{tYx — Y 2 ) 2 ] & 0 para 
cualquier numero real t, o bien, de manera equivalente, 

t 2 E{Y\) - 2tE(Y\ Y 2 ) + E(Y\) > 0. 

Esta es una expresion cuadratica de la forma A? 2 + Bt + C y como es no negativa, se tiene que B 2 - 
4AC £ 0. La desigualdad anterior se deduce directamente.] 

b Denote con p el coeficiente de correlacion de Fj y Y 2 . Usando la desigualdad del inciso a, demuestre 
que p 2 — 1. 


CAPITULO 6 


Funciones de variables 
aleatorias 


6.1 Introduccion 

6.2 Determinacion de la distribucion de probabilidad de una funcion de variables aleatorias 

6.3 Metodo de las funciones de distribucion 

6.4 Metodo de las transformaciones 

6.5 Metodo de las funciones generadoras de momento 

6.6 Transformaciones multivariantes usando jacobianos (opcional) 

6.7 Estadfsticos de orden 

6.8 Resumen 

Bibliograffa y lecturas adicionales 


6.1 Introduccion 

Como ya indicamos en el Capftulo 1, el objetivo de la estadfstica es hacer inferencias acerca 
de una poblacion con base en informacion contenida en una muestra tomada de esa poblacion. 
Cualquier inferencia verdaderamente util debe ser acompanada por una medida de bondad 
asociada. Cada uno de los temas que se estudiaron en los capftulos anteriores desempena un 
papel en el desarrollo de la inferencia estadfstica. No obstante, ninguno de los temas exami- 
nados hasta aquf esta relacionado con el objetivo de la estadfstica en forma tan cercana como 
el estudio de las distribuciones de funciones de variables aleatorias. Esto se debe a que todas 
las cantidades empleadas para calcular parametros poblacionales o tomar decisiones acerca de 
una poblacion, son funciones de las n observaciones aleatorias que aparecen en una muestra. 

Para ilustrar, considere el problema de estimar una media poblacional, /jl. De manera in- 
tuitiva tomamos una muestra aleatoria de n observaciones, y v y 2 , . . . , y n , de la poblacion y 
utilizamos la media muestral 


_ yi + y 2 + • " + y„ 

y = - 



296 




6.2 Determinacion de la distribucion de probabilidad de una funcion de variables aleatorias 297 


como estimacion de /jl. ^Que tan buena es esta estimacion? La respuesta depende del com- 
portamiento de las variables aleatorias Y x , V 2 , , Y n y su efecto en la distribucion de 

Y = {l/n)YZ =1 Yi. 

El error de estimacion, la diferencia entre la estimacion y el parametro estimado (para 
nuestro ejemplo, la diferencia entre y y fi) constituyen una medida de la bondad de una es¬ 
timacion. Como Y x , Y 2 ,. . . , Y n son variables aleatorias, al repetir el muestreo, Y tambien es 
una variable aleatoria (y una funcion de las n variables F h Y 2 ,..., Y n ). Por tanto, no podemos 
estar seguros de que el error de estimacion sea menor que un valor especifico, B, por ejem¬ 
plo. Sin embargo, si pudieramos determinar la distribucion de probabilidad del estimador F, 
la utilizarfamos para determinar la probabilidad de que el error de estimacion sea menor o 
igual a B. 

Para determinar la distribucion de probabilidad para una funcion de n variables aleatorias, 
Fj, Y 2 , ... , Y n , debemos calcular la distribucion de probabilidad conjunta para las variables 
aleatorias mismas. Por lo general suponemos que las observaciones se obtienen mediante 
muestreo aleatorio, como se definio en la Section 2.12. Vimos en la Section 3.7 que el mues¬ 
treo aleatorio a partir de una poblacion finita (muestreo sin restitution) resulta en intentos 
dependientes, que se hacen esencialmente independientes si la poblacion es grande cuando se 
compara con el tamano de la muestra. 

En todo el resto de este libro supondremos que las poblaciones son grandes en compara- 
cion con el tamano muestral y, en consecuencia, que las variables aleatorias obtenidas a traves 
de muestreo aleatorio son, de hecho, independientes entre sf. Entonces, en el caso discreto, la 
funcion de probabilidad conjunta para las variables F h Y 2 ,, Y n , seleccionadas de la misma 
poblacion, esta dada por 

p(y i, yi, ■ ■ •. y n ) = p(y\)p(yi) ■ ■ ■ p(y n )■ 

En el caso continuo, la funcion de densidad conjunta es 

f(y i, F2, ■ • •, y n ) = f(y\)f{yi) ■ ■ ■ f(y ,,)■ 

El enunciado “F,, Y 2 , ... , Y n es una muestra aleatoria de una poblacion con densidad fly)” 
significa que las variables aleatorias son independientes con funcion de densidad comiin 

m 


6.2 Determinacion de la distribucion 
de probabilidad de una funcion de 
variables aleatorias 

En esta section presentaremos tres metodos para determinar la distribucion de probabilidad 
para una funcion de variables aleatorias y un cuarto metodo para determinar la distribucion 
conjunta de varias funciones de variables aleatorias. Cualquiera de estos metodos se puede 
emplear para determinar la distribution de una funcion dada de las variables, pero por lo gene¬ 
ral, uno de los metodos lleva a un proceso mas sencillo que los otros. El metodo que funciona 
“mejor” varfa de una aplicacion a otra. En consecuencia, el conocimiento de los primeros tres 
metodos es deseable. El cuarto metodo se presenta en la Section 6.6 (optional). Aun cuando 
los tres primeros metodos se estudiaran por separado en las siguientes tres secciones, aquf 
damos un breve resumen de cada uno de ellos. 
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Funciones de variables aleatorias 


Considere las variables aleatorias Y t , Y 2 ,... , Y n y una funcion U(Y V Y 2 , . . . , Y n ), denotada 
simplemente como U. Entonces tres de los metodos para determinar la distribucion de proba- 
bilidad de U son los siguientes: 

1 . Metodo de las funciones de distribucion: se emplea generalmente cuando las Y tienen 
distribuciones continuas. Primero se determina la funcion de distribucion para U, F v (ii) 
= P(U s u), usando los metodos que estudiamos en el Capftulo 5. Para hacerlo, debe- 
mos determinar la region en el espacio y u y 2 , . ■ ■ , para la cual U < u v entonces se 
determina P(U < u) al integrar/jj 1; y 2 , . . . , y n ) para esta region. La funcion de densi- 
dad para U se obtiene entonces al diferenciar la funcion de distribucion, P,j(u). En la 
Seccion 6.3 presentaremos una explication detallada de este procedimiento. 

2. Metodo de las transformaciones: si nos dan la funcion de densidad de una variable 
aleatoria Y, el metodo de transformaciones resulta en una expresion general para la den¬ 
sidad de U = h(Y), donde h(y) es una funcion creciente o decreciente. Entonces, si K, y 
Y 2 tienen una distribucion bivariante, podemos usar el resultado univariante explicado 
antes para hallar la densidad conjunta de Y t y U = h( Y v Y 2 ). Al integrar para y,, encon- 
tramos la funcion de densidad de probabilidad marginal de U, que es nuestro objetivo. 
Este metodo se ilustra en la Seccion 6.4. 

3. Metodo de las funciones generadoras de momento: esta basado en el teorema de uni- 
cidad, el Teorema 6.1, el cual expresa que si dos variables aleatorias tienen funciones 
generadoras de momento identicas, las dos poseen las mismas distribuciones de proba¬ 
bilidad. Para usar este metodo es necesario determinar la funcion generadora de mo¬ 
mento de U y compararla con las funciones generadoras de momento para las variables 
aleatorias discretas y continuas comunes deducidas en los Capftulos 3 y 4. Si aquella 
es identica a una de estas funciones generadoras de momento, la distribucion de pro¬ 
babilidad de U se puede identificar debido a la unicidad del teorema. Las aplicaciones 
del metodo de funciones generadoras de momento se presentaran en la Seccion 6.5. Las 
funciones generadoras de probabilidad se pueden emplear en forma semejante al meto¬ 
do de funciones generadoras de momento. Si el lector esta interesado en su uso, vea la 
bibliograffa al final del capftulo. 


6.3 Metodo de las funciones de distribucion 

Ilustraremos el metodo de funciones de distribucion con un ejemplo sencillo univariante. Si 
Y tiene funcion de densidad de probabilidad fly) y si U es alguna funcion de Y, entonces 
podemos calcular F v (u) = P(U < u) directamente al integrar fly) en la region para la cual 
U < u. La funcion de densidad de probabilidad para U se encuentra al derivar F v (u). El si- 
guiente ejemplo ilustra el metodo. 


EJ EM P LO 6.1 Un proceso para refinar azucar rinde hasta 1 tonelada de azucar puro al dfa, pero la cantidad 
real producida, Y, es una variable aleatoria debido a descomposturas de maquinas y otros pro- 
blemas. Suponga que Y tiene funcion de densidad dada por 


f(y) = 


2y, 0 < y < 1, 

0, en cualquier otro pun to. 
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A la companfa se le paga a razon de $300 por tonelada de azucar refinada, pero tambien 
tiene un costo fijo general de $100 por dra. Por tanto, la utilidad diaria, en cientos de dolares, 
es U = 3T — 1. Encuentre la funcion de densidad de probabilidad para U. 

Solucion Para utilizar el metodo de funcion de distribucion, debemos hallar 

Fu(u) = P(U < u) = P(3Y - 1 <u) = P (y < U ^~ 


Si u < -1, entonces (u + l)/3 < 0 y, por tanto, F^u) = P(Y < (u + l)/3) = 0. Tambien, 
si u > 2, entonces (u + l)/3 >1 y F v {u) = P(Y < (u + l)/3) =1. No obstante, si -1 < u < 
2, la probabilidad se puede escribir como una integral de /Ty), y 


P Y < 


u + 1 


L 


(»+ 0/3 


f(y)dy = 


L 


(« + 1)/3 


2y dy = 


u + 1 


(Observe que, cuando Y varfa de 0 a 1, U varra de -1 a 2.) Entonces, la funcion de distribucion 
de la variable aleatoria U esta dada por 


F v (u) 



u < — 1 , 


-1 <M <2, 


u > 2 , 


y la funcion de densidad para U es 


fu(u ) 


dFu(u) = j (2/9)(« + 1), 
du \ 0, 


-1 < u <2, 

en cualquier otro punto. ■ 


En la situacion bivariante, sean Y { y Y 2 variables aleatorias con densidad conjunta^yj, y 2 ) 
y sea U = h( Y t , Y 2 ) una funcion de K, y Y 2 . Entonces, para todo punto (y,, y 2 ), corresponde un 
valor y solo uno de U. Si podemos precisar la region de valores (y,, _y 2 ) tal que U < u, entonces 
la integral de la funcion de densidad conjunta/ljj, y 2 ) para esta region es igual a P(iJ < u) = 
F^u). Como antes, la funcion de densidad para U se puede obtener por derivacion. 

Ilustraremos estas ideas con dos ejemplos. 


EJ EMPLO 6.2 En el Ejemplo 5.4 consideramos las variables aleatorias K, (la cantidad proporcional de ga- 
solina abastecida al principio de semana) y Y 2 (la cantidad proporcional de gasolina vendida 
durante la semana). La funcion de densidad conjunta de Y\ y Y 2 esta dada por 


f(yu yi) 


3.V1, o < y 2 < yi < 1, 

0, en cualquier otro punto. 


Encuentre la funcion de densidad de probabilidad para U = Y x — Y 2 , la cantidad proporcio¬ 
nal de gasolina remanente al final de la semana. Use la funcion de densidad de U para hallar 
E(U). 
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FIGU RA 6.1 
Region en la cual 
f(y v y 2 ) es positiva, 
Ejemplo 6.2 


Solucion 


La region en la cual /(y h y 2 ) no es cero, asf como la Ifnea v, — y 2 = u, para un valor de u entre 
0 y 1 se muestran en la Figura 6.1. Observe que cualquier punto (v 1; y 2 ) tal que V| — y 2 — 11 se 
encuentra sobre la recta y, — y 2 = u. 

Si u < 0, la recta y, — y 2 = u tiene punto de interseccion -u < 0 y F^u) = P(Y l — 
y, < u) = 0. Cuando u> 1, la recta y, — y 2 = u tiene punto de interseccion —u<— 1 y F v (u) 
= 1. Para 0 < « < 1, F lf ( u) = P(Y l — L, < u) es la integral sobre la region sombreada oscura 
localizada arriba de la recta Vj — y, = u. Como es mas facil integrar sobre la region triangular 
inferior, podemos escribir, para 0 < u < 1 , 


FIGURA 6.1 
Region en la cual 
f(y v y 2 ) es positiva, 
Ejemplo 6.2 


Solucion 


Fu(u ) = P(U < u) = 1 - P(U > u) 


= 1 - 






Resumiendo, 


' 0 , 

Fui.ii ) = • (3m — n 3 )/2, 


M < 0, 

0 < M < 1, 
M > 1. 


1 , 


Una grafica de F v (u) se muestra en la Figura 6.2(a). 
Se deduce que 

dFuiu ) _ f 3(1 -m 2 )/2, 

—dS-lo. 


0 < u < 1, 

en cualquier otro punto. 


La funcion de densidad / f/ (M) se grafica en la figura 6.2(b). 
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(a) Funcion de distribucion (b) Funcion de densidad 


Podemos usar esta funcion de densidad para hallar E(U), porque 


E(U) 



(1 — u 1 ) du 


3 / u 2 m 4 \ 1 

2 V2"~ Vjo 


3 

8 ’ 


lo cual concuerda con el valor de E(Y l — Y 2 ) encontrado en el Ejemplo 5.20 con el uso de me- 
todos desarrollados en el Capitulo 5 para deducir el valor esperado de una funcion lineal de 
variables aleatorias. ■ 


EJ EM P LO 6.3 Denote con (F I? Y 2 ) una muestra aleatoria de tamano n = 2 proveniente de la distribucion uni¬ 
forme del intervalo (0, 1). Encuentre la funcion de densidad de probabilidad para U = Y x + Y 2 . 


Solution La funcion de densidad para cada Y t es 


f(y) 


ri, o<j<l 

I 0, en cualquier otro punto. 


Por tanto, como tenemos una muestra aleatoria, Y t y Y 2 son independientes, y 


f(y i, yi) = f{y\)f(yi) 


1 , 0 < yi < 1 , 0 < y 2 < 1 , 

0, en cualquier otro punto. 


Las variables aleatorias K, y Y 2 tienen densidad diferente de cero en el cuadrado unitario, 
como se ve en la Figura 6.3. Deseamos determinar /*',,(«) = P(U < u). El primer paso es 
localizar los puntos (y p y 2 ) que implican que y : + y 2 < u. La forma mas facil de encontrar 
esta region es localizar los puntos que dividen las regiones U < u y U > u. Estos puntos se 
encuentran en la recta y, + y 2 = u. 

A1 graficar esta relation en la figura 6.3 y en forma arbitraria seleccionar y 2 como la varia¬ 
ble dependiente, encontramos que la recta posee una pendiente igual a -1 y un punto de inter¬ 
section y 2 igual a it. Los puntos asociados con U < u estan ya sea arriba o debajo de la recta 
y pueden ser determinados al probar puntos en cualquiera de los lados de la recta. Suponga 
que u = 1.5. Sea y { = y~, = 1/4; entonces + y 2 = 1/4 + 1/4 = 1/2 y (y 1; y 2 ) satisface la 
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F I G U R A 6.3 
Region de integracion 
para el Ejemplo 6.3 



desigualdad y, + y 2 < it. Por tanto, y, = y 2 = I /4 cae en la region sombreada debajo de la 
recta. Del mismo modo, todos los puntos tales que >’ i + y 2 < u estan debajo de la recta y ] + 
y 2 = u. Asf, 


Si u < 0, 


F v (u) = P(U < u) = P(Y\ + Y 2 <u) = JJ f(yu y 2 ) dyi dy 2 . 

yi +y 2 <u 

F v (u) = P(U <m) = JJ f{yu y 2 )dyi dy 2 = JJ 0dyidy 2 =0 

yi+y2-u y 1 +y 2 ^u 


y para u > 2, 

Fu(u) = P(U < u) 



f(y l, yi)dy\ dy 2 


yi+y 2 < u 



(1) dyi dy 2 = 1. 


Para 0 < u < 2, los lfmites de integracion dependen del valor particular de u (donde u es 
el punto de interseccion y 2 de la recta y, + y 2 = u). En consecuencia, la expresion matematica 
para F v (u) cambia dependiendo de si 0 < i/ < 1 o I < a < 2. 

Si 0 < u < 1, la region y, + y 2 < u, es el area sombreada de la Figura 6.4. Entonces, para 
0 < u < 1, tenemos 


Fu(u) 


// 

yi+yi^u 


f(yu yi) dy\ dy 2 



(1) dy\ 


dyi = / (u - y 2 ) dy 2 
Jo 



2 ' 


La solucion, F^u), 0 < it < 1, podrfa haberse obtenido directamente con geometrfa ele¬ 
mental. La densidad bivariante/(>’ h y 2 ) = 1 es uniforme en el cuadrado unitario 0 < y, < 1, 
0 < y 2 < 1. Por tanto, F (] (u ) es el volumen de un solido de altura igual a f(y ,, y 2 )= 1 y una 
seccion transversal triangular, como se ve en la Figura 6.4. En consecuencia, 

2 2 

u u 

Fyiu.) = (area de triangulo) ■ (altura) = — (1) = —. 

La funcion de distribucion se puede obtener de un modo semejante cuando u esta definida 
en el intervalo 1 < it < 2. Aun cuando la solucion geometrica es mas facil, obtendremos F u (u) 
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directamente por integration. La region y l + y 2 < u, 1 < u < 2 es el area sombreada indicada 
en la Figura 6.5. 

El complemento del evento U s u es el evento de que (K,, Y 2 ) caiga en la region A de la 
figura 6.5. Entonces, para 1 < u < 2, 


F v (u) = 1 


Para resumir, 


-u 


f(yu yi)dyi dy 2 


l 


= 1 


= 1 


If 

f (1 -u 

Ju-\ 


(1) dy\ dy 2 = 1 


/' 

Ju -1 


nl 


y i 


dy2 


+ yi) dy 2 = 1 - | (1 - u)y 2 + y 


2n 


w-l 


= (—m 2 /2) +2m - 1. 


Fu(u) = 


(—m 2 /2) + 2n — 1, 1 <m<2, 

1, u > 2. 

La funcion de distribucion para U se muestra en la Figura 6.6(a). 


0, 

u 2 /2. 


u < 0 , 

0 < u < 1, 



o 


l 
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FIGURA 6.6 
Funciones 
de distribucion y 
de densidad para el 
Ejemplo 6.3 




(a) Funcion de distribucion 


(b) Funcion de densidad 


La funcion de densidad fj/ju) se puede obtener al derivar F v (u). Entonces, 


fu(u) = 


dFu(u) 

du 


{ 


o 

II 

p 

< 0, 

£(« * 1 2 3 4 / 2 ) = u . 

0 < u < 1, 

£[(-n 2 /2) +2 m - 1] = 2 -u. 

1 < u < 2, 

o 

II 

■48 

u > 2, 


o bien, lo que es mas sencillo, 

/t/O) = 


u, 0Sb<1, 

2 — u, 1 < w < 2, 

0, en cualquier otro pun to. 


Una grafica de/ ( ,(Mj se muestra en la Figura 6.6(b). 


Resumen del metodo de las funciones de distribucion 

Sea U una funcion de las variables aleatorias Y v Y 2 ,..., Y n . 

1. Localice la region U = u del espacio (y 1; y 2 ,... , y n ). 

2. Localice la region U < it. 

3. Determine F v (u) = P(U < u) al integrar/(yj, y 2 ,. . ., y n ) sobre la region 
i/< u. 

4. Determine la funcion de densidad f v (u) al derivar F v {u). Por tanto v / ( ,(M) = 
d FJjYi/du. 


Para ilustrar, considere el caso U = h(Y) = Y 2 , donde Y es una variable aleatoria continua 
con funcion de distribucion Fy(y) y funcion de densidad/ K (y). Si u < 0, F l; (u) = P(U < u) = 
P(Y 2 < m) = 0 y para u > 0 (vea la Figura 6.7), 


Fu(u ) 


P(U <n) = P(Y 2 <m) 
P(~Vu < Y <Vm) 

" f(y) dy = F y (Vu) 


/ v« 
V«' 


Fy(-V «)■ 
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FIGURA 6.7 

Funcion h{y) = y 2 


EJEMPLO 6.4 


Solucion 



En general, 

F y (\/u) - F y (-\/u), u > 0, 

0, en cualquier otro punto. 

A1 derivar con respecto a n, vemos que 


Fu(u) = 


fu(u) = 


/y(Vw) ( -—p') + fy{ VU )(-—— ), U > 0, 


2 y/u 


2 V« 


0, 


en cualquier otro punto, 


o bien, simplemente, 


1 


fu(u) = j 2 \/m 

^ 0, 


[/y(Vw) + /y( Vm)], > 0, 

en cualquier otro punto. 


Sea Y una funcion de densidad de probabilidad dada por 

y + 1 


friy) = 


-l<y<l, 


0, en cualquier otro punto. 

Encuentre la funcion de densidad para U = Y 2 . 

Sabemos que 

1 


fu(u) = 


2 Vm 

0, 

y al sustituir en esta ecuacion obtenemos 

1 

fu(ii) = * 


[f Y (Vu) + f Y (~Vm)], u > 0, 

en cualquier otro punto, 


/\/u + 1 —'v/n + 1 \ 1 

+ ^0<n<l, 
2 \/u V 2 2 / 2 y/u 

0, en cualquier otro punto. 
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Como Y tiene densidad positiva solo en el intervalo -1 
densidad positiva solo en el intervalo 0 < w < 1. 


y£ 1, se deduce que U = Y 2 tiene 


En algunos casos es posible encontrar una transformacion que cuando se aplica a una varia¬ 
ble aleatoria con distribucion uniforme en el intervalo (0, 1), resulta en una variable aleatoria 
con alguna otra funcion de distribucion especffica, por ejemplo F(y). El siguiente ejemplo 
ilustra una tecnica para lograr este objetivo. A este le sigue un breve analisis de una de las 
aplicaciones practicas de esta transformacion. 


EJ EMPLO 6.5 Sea U una variable aleatoria uniforme en el intervalo (0, 1). Encuentre una transformacion 
G{U) tal que G(U) posea una distribucion exponencial con media [3. 


Solucion Si U posee una distribucion uniforme en el intervalo (0, 1), entonces la funcion de distribucion 
de U (vea Ejercicio 4.38) esta dada por 


Fu(u) 


0, u < 0, 

u, 0 < u < 1 , 

1, u > 1. 


Denote con Y una variable aleatoria que tiene una distribucion exponencial con media (3. 
Entonces (vea la Seccion 4.6) Y tiene funcion de distribucion 


Fr(y) 


0, y < 0, 

1 — e~ y !P, y>0. 


Observe que F v (y ) es estrictamente creciente en el intervalo [0, oo). Sea 0 < it < 1 y ad- 
vierta que hay un valor unico y tal que F Y (y) = u. Asf, F y 1 ( m) , 0 < u < 1 esta bien definido. 
En este caso, Fy( v) = 1 — = u si y solo si y = — /3ln( 1 — u) = F Y l (u). Considere la 

variable aleatoria F Y l (U) = —/31n( 1 —U) y observe que, si y > 0. 


P(F~\U)<y) = P[-(3ln(l-U)<y] 

= E[ln(l — U) > -y/(3] 

= P(U < 1 - 
= 

Tambien, E , [FjT 1 (t/) < y] = 0 si y s 0. Asf, F Y l (U) = — /31n(l — U ) posee una distribu¬ 
cion exponencial con media / 3 , como se desea. ■ 


Las simulaciones por computadora se usan con frecuencia para evaluar tecnicas estadlsti- 
cas propuestas. Por lo general estas simulaciones requieren que obtengamos valores observa- 
dos de variables aleatorias con distribucion prescrita. Como se observo en la Seccion 4.4, casi 
todos los sistemas computarizados contienen una subrutina que genera valores observados 
de una variable aleatoria U que tiene una distribucion uniforme en el intervalo (0, 1). ^Como 
puede usarse el resultado del Ejemplo 6.5 para generar un conjunto de observaciones a partir 
de una distribucion exponencial con media [31 Simplemente usamos el generador de numeros 
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aleatorio de la computadora para producir valores u v u 2 ,, u n de una distribucion uniforme 
(0, 1) y luego calculamos y, = ~/3 ln(l — u t ), i = 1,2,...,« para obtener valores de variables 
aleatorias con la distribucion exponencial requerida. 

Mientras una funcion de distribucion prescrita F(y) posea una inversa unica F ~ l (-), se puede 
aplicar la tecnica anterior. En casos como el ilustrado en el Ejemplo 6.5 podemos facilmente 
escribir la forma de F _I ( ) y continuar como antes. Si la expresion de una funcion de distribu¬ 
cion no se puede escribir en una forma facilmente invertible (recuerde que las funciones de 
distribucion de variables aleatorias de distribucion normal, gamma y beta se determinan por 
medio de tablas que se obtuvieron con el uso de tecnicas de integration numerica), nuestro 
trabajo es mas dificil. En estos casos se usan otros metodos para generar observaciones con 
la distribucion deseada. 

En el siguiente conjunto de ejercicios encontrara problemas que se pueden resolver con el 
uso de las tecnicas presentadas en esta section. Los ejercicios que implican determinar F~ l (U) 
para alguna distribucion especffica F(y) se concentran en casos donde F~ l (-) existe en forma 
cerrada. 


Ejercicios 


6.1 Sea Y una variable aleatoria con funcion de densidad de probabilidad dada por 


f(y) 


2(1 -y), 0<y<l, 

0, en cualquier otro punto. 


a Encuentre la funcion de densidad de U 1 = 2Y — 1. 

b Encuentre la funcion de densidad de U 2 = 1 — 2 Y. 

c Encuentre la funcion de densidad de U 3 = Y 2 . 

d Encuentre E(U j), E(U 2 ) y E(U 3 ) usando las funciones de densidad obtenidas para estas variables 

aleatorias. 

e Encuentre E(U{), E(U 2 ) y E(U 3 ) con los metodos del Capftulo 4. 

6.2 Sea Y una variable aleatoria con una funcion de densidad dada por 

(3/2)y 2 , -l<y<l, 

f(y) = ' n j . 

0, en cualquier otro punto. 

a Encuentre la funcion de densidad de U 1 = 3Y . 

b Encuentre la funcion de densidad de U 2 = 3 — Y. 

c Encuentre la funcion de densidad de U 3 = Y 2 . 

6.3 Un proveedor de queroseno tiene una demanda semanal Y que posee una funcion de densidad de proba¬ 
bilidad dada por 

I y, 0<y<l, 

1, l<y<1.5, 

0, en cualquier otro punto, 

con mediciones en cientos de galones. (Este problema planted en el Ejercicio 4.13.) La utilidad del 
proveedor esta dada por U = 10F — 4. 

a Encuentre la funcion de densidad de probabilidad para U. 
b Use la respuesta al inciso a para encontrar E(U). 
c Encuentre E(U) con los metodos del Capftulo 4. 
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6.4 La cantidad de harina consumida por dla en una panaderfa es una variable aleatoria Y que tiene una 
distribucion exponencial con media igual a 4 toneladas. El costo de la harina es proporcional a U = 
3 Y+ 1. 

a Encuentre la funcion de densidad de probabilidad para U. 
b Use la respuesta del inciso a para hallar E{U). 

6.5 El tiempo de espera Y hasta la entrega de un nuevo componente para una operation industrial esta uni- 
formemente distribuido en el intervalo de 1 a 5 dlas. El costo de esta demora esta dado por U = 2 Y 2 + 
3. Encuentre la funcion de densidad de probabilidad para U. 

6.6 La distribucion conjunta de la cantidad de contaminantes emitida desde una chimenea sin aparato lim- 
piador (Fj) y una chimenea igual pero con aparato limpiador (F 2 ) se dio en el Ejercicio 5.10 como 


/O’t. yi) = 


1, 0 £ yi £ 2, 0 < y 2 ^ 1, 2 y 2 y\, 

0, en cualquier otro punto. 


La reduction en la cantidad de contaminantes debida al aparato limpiador esta dada por U — Fj — Y 2 . 
a Encuentre la funcion de densidad de probabilidad para U. 

b Use la respuesta del inciso a para hallar E(U). Compare sus resultados con los del Ejercicio 5.78(c). 

6.7 Suponga que Z tiene una distribucion normal estandar. 
a Encuentre la funcion de densidad de U = Z 2 . 

b iU tiene una distribucion gamma? ^Cuales son los valores de a y j8? 
c ^Cual es otro nombre para la distribucion de U7 

6.8 Suponga que Y tiene una distribucion beta con parametros a y fi. 
a Encuentre la funcion de densidad de U = 1 - Y. 

b Identifique la densidad de U como uno de los tipos que estudiamos en el Capftulo 4. Asegurese de 
identificar cualesquiera valores de parametro. 
c ^Como estan relacionadas E(U) y E(Y)7 
d ^Como estan relacionadas V(U) y V(Y)7 

6.9 Suponga que una unidad de mineral contiene una proportion Y 1 de metal A y una proportion Y 2 de 
metal B. La experiencia ha demostrado que la funcion de densidad de probabilidad conjunta de Fj y Y 2 
es uniforme en la region 0 £ y t £ 1, 0 ^ y, £ 1, 0 £ y x + y 2 £ 1. Sea U = Y 1 + Y 2 , la proportion del 
metal A o B por unidad. Encuentre 

a la funcion de densidad de probabilidad para U. 
b E(U) usando la respuesta al inciso a. 
c E(U) usando solo las densidades marginales de Fj y Y 2 . 

6.10 El tiempo total desde la llegada hasta la termination del servicio en un restaurante de comida rapida, Fj, 
y el tiempo empleado en la fila de espera antes de llegar a la ventanilla de servicio, Y 2 , se dieron en el 
Ejercicio 5.15 con funcion de densidad conjunta 


f(y t, > 2 ) = 


0 £ V 2 — yi < oo, 

en cualquier otro punto. 


Otra variable aleatoria de interes es U = Fj — Y 2 , el tiempo empleado en la ventanilla de servicio. 
Encuentre 

a la funcion de densidad de probabilidad para U. 

b E(U) y V(U). Compare sus respuestas con los resultados del Ejercicio 5.108. 
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6.11 Suponga que dos componentes electronicos del sistema de gufa de un proyectil operan de manera inde- 
pendiente y que cada uno tiene una vida util gobernada por la distribucion exponencial con media 1 (con 
mediciones en cientos de horas). Encuentre la 

a funcion de densidad de probabilidad para el promedio de vida util de los dos componentes. 
b media y la varianza de este promedio, usando la respuesta del inciso a. Compruebe su respuesta al 
calcular la media y la varianza con el Teorema 5.12. 

6.12 Suponga que F tiene una distribucion gamma con parametros a y j3 y que c > 0 es una constante. 
a Deduzca la funcion de densidad de U = cY. 

b Identifique la densidad de U como uno de los tipos que estudiamos en el Capitulo 4. Asegurese de 
identificar cualesquiera valores de parametro. 

c Los parametros a y /3 de una variable aleatoria con distribucion gamma son, respectivamente, para¬ 
metros de “forma” y “escala”. ^Como se comparan los parametros de escala y forma para U con los 
de F? 

6.13 Si Fj y F 2 son variables aleatorias exponenciales independientes, ambas con media /3, encuentre la 
funcion de densidad para la suma de ellas. (En el Ejercicio 5.7 consideramos dos variables aleatorias 
exponenciales independientes, ambas con media 1 y P(Y 1 + F, £ 3) determinada.) 

6.14 En un proceso de sinterizacion (calentamiento) de dos tipos de polvo de cobre (vea el Ejercicio 5.152), la 
funcion de densidad para Fj, la proportion de volumen de cobre solido en una muestra, estuvo dada por 


Myi) = 


6yi(i-yi), 0<y!<l, 

0, en cualquier otro punto. 


La funcion de densidad para F 2 , la proportion de cristales tipo A entre el cobre solido, estuvo dada por 

/2(v 2 ) = 


3F 2 2 , 


0, 


0 < y 2 =£ 1, 

en cualquier otro punto. 


La variable U = Y l Y 2 da la proportion del volumen de la muestra debida a los cristales tipo A. Si F, y 
F 2 son independientes, encuentre la funcion de densidad de probabilidad para U. 

6.15 Sea F una funcion de distribucion dada por 


F(y) 


0, y < 0, 

l-e~ y \ y>0. 


Encuentre una transformation G(U) tal que, si U tiene una distribucion uniforme en el intervalo (0, 1), 
G(U) tiene la misma distribucion que F. 

6.16 En el Ejercicio 4.15 determinamos que 

b 

-a- y- b > 

r 

0, en cualquier otro punto, 

es una funcion de densidad de probabilidad autentica para una variable aleatoria, F. Suponiendo que b es 
una constante conocida y U tiene una distribucion uniforme en el intervalo (0, 1), transforme U para 
obtener una variable aleatoria con la misma distribucion que F. 



6.17 


Un miembro de la familia de distribuciones de potencia tiene una funcion de distribucion dada por 


F(y) 


0. 



y < 0, 

0 <y <0, 

y > e. 


donde a, 9 > 0. 
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a Encuentre la funcion de densidad. 

b Para valores fijos de a y 6 encuentre una transformacion G(U) de modo que G(U) tenga una funcion 
de distribution de F cuando U posea una distribution uniforme (0, 1). 
c Dado que una muestra aleatoria de tamano 5 tomada de una distribution uniforme en el intervalo (0, 1) 
dio los valores .2700, .6901, .1413, .1523 y .3609, use la transformacion que obtuvo en el inciso b 
para dar valores asociados con una variable aleatoria con una familia de distribution de potencia con 
a = 2, 6 = 4. 

6.18 Un miembro de la familia de distribuciones de Pareto (que se usa a menudo en economfa para modelar 
distribuciones de ingreso) tiene una funcion de distribution dada por 


F(y) 


0, y < j8. 



donde a, /3> 0. 

a Encuentre la funcion de densidad. 

b Para valores fijos de /3 y a, encuentre una transformacion G(U) de modo que G(U) tenga una funcion 
de distribution de F cuando U posea una distribution uniforme en el intervalo (0, 1). 
c Dado que una muestra aleatoria de tamano 5 tomada de una distribution uniforme en el intervalo (0, 
1) dio los valores .0058, .2048, .7692, .2475 y .6078, use la transformation que dedujo en el inciso 
b para dar valores asociados con una variable aleatoria con una distribution de Pareto con a — 2, 

0 = 3. 

6.19 Consulte los Ejercicios 6.17 y 6.18. Si Y posee una distribution de Pareto con parametros a y (3, demues- 
tre que X = l/Y tiene una familia de distribution de potencia con parametros a y 6 = /3 _1 . 

6.20 Sea la variable aleatoria Y que tiene una distribution uniforme en el intervalo (0, 1). Deduzca 

a la distribution de la variable aleatoria W = Y 2 , 
b la distribution de la variable aleatoria VP = \/F. 

*6.21 Suponga que Y es una variable aleatoria que toma solo valores enteros 1,2,... Denote con F(v) la fun¬ 
cion de distribution de esta variable aleatoria. Como ya vimos en la Section 4.2, esta funcion de distri¬ 
bution es una funcion escalon y la magnitud del escalon en cada valor entero es la probabilidad de que Y 
tome ese valor. Sea U una variable aleatoria continua que esta uniformemente distribuida en el intervalo 
(0, 1). Defina una variable X tal que X = k si y solo si F(k — 1) < t/ < F(k), k = 1,2,... Recuerde que 
F(0) = 0 porque Y toma solo valores enteros positivos. Demuestre que P{X = i) = F[i) - F(i - 1) = 
P[Y = i), i=l,2,... Esto es, X tiene la misma distribution que Y. [Sugerencia: recuerde el Ejercicio 
4.5.] 1 

*6.22 Use los resultados que obtuvo en los Ejercicios 4.6 y 6.21 para describir como generar valores de una 
variable aleatoria geometricamente distribuida. 


6.4 Metodo de las transformaciones 

El metodo de las transformaciones, el cual nos permite determinar la distribution de proba¬ 
bilidad de una funcion de variables aleatorias, es una consecuencia del metodo de funcion de 
distribucion de la Section 6.3. Mediante el metodo de las funciones de distribution podemos 
llegar a un metodo simple para formular la funcion de densidad de LJ = h(Y), siempre que h{y) 


1. Los ejercicios precedidos de un asterisco son opcionales. 
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FIGURA 6.8 
Una funcion 
creciente 


EJEMPLO 6.6 



sea decreciente o creciente. [Por h(y) creciente, queremos decir que si v, < y 2 , entonces h(y j) 
< h(y 2 ) para cualesquiera numeros reales v, y y 2 .] La grafica de una funcion creciente h(y) 
aparece en la Figura 6.8. 

Suponga que h(y) es una funcion creciente de y y que U = h(Y), donde Y tiene funcion de 
densidad/ K (v). Entonces h '(u) es una funcion creciente de u : si u l < u 2 , entonces h * l (u 1 ) = 
y | < y 2 = h~\u 2 ). En la figura 6.8 vemos que el conjunto de puntos y tales que h(y) < tq es 
precisamente igual que el conjunto de puntos y tales que y < /r'Oq). Por tanto ( vea la Figura 
6.8), 


P(U < u) = P[h{Y) < u] = P{ir l [h(Y)] < h~\u)} = P[Y < h^(u)] 


o bien, 


Fuiu) = Fy[h-\u)}. 

Entonces derivando con respecto a u, tenemos 

dFuiu) dF Y [h~\u)] , d[h-\u)] 

fu(u) = —-- = --- = f Y (h («))---. 

au du du 

Para simplificar la notacion, escribiremos dlY l /du en lugar de d[lf l {ii)]/du y 

. dh 

Mu) = f Y [h-\u)] — . 

du 

En consecuencia, tenemos una nueva forma para determinar/^f u) que surge a partir del me¬ 
todo general de funciones de distribucion. Para detcrminar / (/ (u), despeje y en terminos de m; 
esto es, encuentre y = h '(«) y sustituya esta expresion en f Y (y). Entonces multiplique esta 
cantidad por dh~ l /du. Ilustraremos el procedimiento con un ejemplo. 


En el Ejemplo 6.1 trabajamos con una variable aleatoria Y (cantidad de azucar producida) con 
una funcion de densidad dada por 

My) = j 2 >', 0<y<l, 

l 0, en cualquier otro punto. 

Estamos interesados en una nueva variable aleatoria (utilidad) dada por U = 3 Y — 1. Encuentre 
la funcion de densidad de probabilidad para U por el metodo de las transformaciones. 
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Solucion La funcion de interes aquf es h(y) = 3y — 1, que es creciente en y. Si u = 3y — 1, entonces 


y = h l (u) = 


u + 1 


dh~ l _ d( s±i) _ 1 


du 


du 


Por tanto, 


Mu) = f Y [h-\u )] 


, dh 1 
du 


2[h-\u)] 

0 , 


, dh 1 /w + 1 \ / 1 
= 2 


du 


u + 1 

0 ~ 3 ~ 1’ 

en cualquier otro punto. 


o bien, lo que es equivalente, 

fuW = 


2(« + l)/9, 

0, en cualquier otro punto. 


El intervalo en el cual f v (u) es positiva es simplemente 0 < y < 1 transformado en el eje u por 
la funcion u = 3y — 1. Esta respuesta esta acorde con la del Ejemplo 6.1. ■ 


Si h(y) es una funcion decreciente de y, entonces h '(u) es una funcion decreciente de u. 
Esto es, si I/, < u 2 , entonces /; '(«) = y, > y 2 = lf\u 2 ). Tambien, como en la Figura 6.9, 
el conjunto de puntos y tales que h(y) < w, es el mismo conjunto de puntos tales que y > 
h~\u i). 

Se deduce que, para U = h(Y), como se ve en la Figura 6.9, 

P(U < w) = P[Y >/t _1 (m)] o Fu(u) = 1 — Ey[/i _1 (w)]. 


Si derivamos con respecto a m, obtenemos 


fuM 


~f Y [h-\u)] 


d[h~\u )] 
du 


FIGURA 6.9 
Una funcion 
decreciente 
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Si de nuevo empleamos la notation simplificada dh ' /du cn lugar dc d [ h 1 (n)] jdu y recordamos 
que dhT * 1 /du es negativa porque h '(it) es una funcion decreciente de it, la densidad de U es 

Mu) = f Y lh-Hu)\ 

En realidad, no es necesario que h(y) sea creciente o decreciente (y por tanto que se pueda 
invertir) para todos los valores de y. La funcion /;(•) solo necesita ser creciente o decreciente 
para los valores de y tales que f Y (y) > 0. El conjunto de puntos {y: / K (y) > 0} se denomina so- 
porte de la dcnsidad/ K (v). Si y = It '(it) no es el soporte de la densidad, entonces/ y [M l (u)\ = 0. 
Estos resultados se combinan en el siguiente enunciado: 


dh~ 

du 


Sea Y la funcion de densidad de probabilidad f Y (y). Si h(y) es creciente o decreciente 
para today tal quc/ K (v) > 0, entonces U = h(Y) tiene funcion de densidad 


Mu) = f Y [h~\u )] 


dh~ l 

du 


donde 


dh 1 
du 


d[h~Hu )] 

du 


EJEMPLO 6.7 


Sea Y la funcion de densidad de probabilidad dada por 


My) 


fly, 0<y<l, 

l 0, en cualquier otro punto. 


Encuentre la funcion de densidad de U = -4Y + 3. 


Solution En este ejemplo, el conjunto de valores de y tales que/ K (y) > 0 son los valores 0 < y < 1. La 
funcion de interes, h(y) = —4y + 3, es decreciente para toda y y, por tanto, para toda 0 < y 
< 1, si u = —Ay + 3, entonces 


y = h *(m) 


3 u dh 1 

4 ^ du 


1 

4' 


Observe que h '(it) es una funcion decreciente de u y que dh 1 /du < 0. Entonces, 


M u ) 


fy\h~\u)] 




< 1 , 


en cualquier otro punto. 


Finalmente, un poco de algebra nos da 


Mu) 


3 — u 

8 

0 , 


-1 <m <3, 

en cualquier otro punto. ■ 


La aplicacion directa del metodo de las transformaciones requiere que la funcion h(y) sea 
creciente o decreciente para toda y tal que f Y (y) > 0. Si desea usar este metodo para hallar 
la distribution de U = M Y), debe tener mucho cuidado de comprobar que la funcion h(-) sea 
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creciente o decreciente para toda y en el soporte de/yly). Si no es asf, el metodo de las trans- 
formaciones no se puede aplicar y en su lugar se puede utilizar el metodo de las funciones de 
distribution estudiadas en la Section 6.3. 

El metodo de las transformaciones tambien se puede emplear en situaciones multivarian- 
tes. El siguiente ejemplo ilustra el caso bivariante. 


EJEMPLO 6.8 Sean Y l y Y 2 que tienen una funcion de densidad conjunta dada por 


f(yi, yi) = 


—(yi +yi) 


OSyj, 0 < y 2 , 

0, en cualquier otro punto. 

Encuentre la funcion de densidad para U = lj + Y 2 . 


Solution Este problema se debe resolver en dos etapas: primero, determinaremos la densidad conjunta 
de lj y U y en seguida la densidad marginal de U. El metodo consiste en asignar a lj un valor 
y, > 0. Entonces U = y x + Y 2 y podemos considerar el problema de transformation unidi¬ 
mensional en el que U = h(Y 2 ) = y, + Y 2 . Si g(y v u ) denota la densidad conjunta de lj y U, 
tenemos, con y 2 = u — y { = h~ l (u), 


g(y t, u) = 


f[yx,h~\u )] 

o, 


dh 


-1 


du 


= e -(yi+«-yi)( 1 ) ; o<yi, 

en cualquier otro punto. 


Simplificando obtendremos 

u) 


e 0 < yi < u, 

0, en cualquier otro punto. 


(Observe que lj < U). La densidad marginal de U esta dada entonces por 


/c/O) 


/ oo 

g(yi, u)dyi 

-oo 

f e~ u dyi = ue~ u , 
Jo 

0, 


0s«, 

en cualquier otro punto. ■ 


Ilustraremos el uso de la transformation bivariante con otro ejemplo que implique el pro- 
ducto de dos variables aleatorias. 


EJEMPLO 6.9 En el Ejemplo 5.19 consideramos una variable aleatoria >j como la proportion de impurezas 
en una muestra quimica y Y 2 como la proportion de impurezas tipo I entre todas las impure¬ 
zas de la muestra. La funcion de densidad conjunta estuvo dada por 

_ | 2(1-)q), 0 < yi < 1 , 0 < y 2 ^ 1 , 

l 0, en cualquier otro punto. 

Estamos interesados en U = Y 1 Y 2 , que es la proportion de impurezas tipo I de la muestra. 
Encuentre la funcion de densidad de probabilidad para U y utilfcela para hallar E(U). 
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Solucion 


Como estamos interesados en U = K, Y 2 , primero asignamos a Y l un valor v,, 0 < y, < 1 y 
pensamos en terminos de la transformation univariante U = h(Y 2 )= v, Y 2 . Podemos entonces 
determinar la funcion de densidad conjunta para F, y LJ (con y 2 = u/y l = li l (u) como 


g(yi, u) 


f[yuh~\u)] 


dh~ l 

du 


2(1 - vi) 

0 , 


1 

yi 


0 < yi < 1, Osw/yi < 1, 

en cualquier otro punto. 


De modo equivalente, se puede expresar como 


g(yu “) 


0, 


0 <« < 1 , 

en cualquier otro punto. 


(U tambien varia entre 0 y 1, pero F, siempre debe ser mayor o igual a U.) Ademas, 

/ OO 

g(yi, u)dyi 

-oo 


J" 2(l- yi )(J-^dy u 0<«<1, 


0, 


en cualquier otro punto. 


Para 0s«<l, 


/' 


2(l- yi )[-jd yi =2j ^--l)Jyi 


f(L 

Ju \y i 

( ln .Vi]l-yi]i) =2(—lnii-l+M) 


obtenemos 


fu(u) = 


= 2 

= 2(u — In u — 1), 

2 (u — In u — 1), 0 — u — 1, 


0, 


en cualquier otro punto. 


(El sfmbolo In significa logaritmo natural.) 
Ahora encontramos E(U ): 


E(U) 



= I 2u(u — \nu — 1) du 
Jo 

J n(ln it) du — J mc/mJ 



u (In u) du 
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La integral de en medio se resuelve con mas facilidad si se usa integration por partes, lo 
cual dara 


/' 


u(lnu) du 


Entonces, 





u 


2 —11 



1 

4' 


E(U) = 2[( 1/3) - (-1/4) - (1/2)] = 2(1/12) = 1/6. 


Esta respuesta concuerda con la del Ejemplo 5.21, donde E(IJ) = E(Y t Y 2 ) se dedujo con un 
metodo diferente. ■ 


Resumen del metodo de las transformaciones 


Sea U = h(Y), donde h(y) es una funcion creciente o decreciente de y para toda v tal que 

Uy) >o. 


1. 

2 . 
3. 


Deduzca la funcion inversa, y = h \u). 

dh~ l d[h-\u )] 

Evalue —-— = ---. 

du du 

Encuentre /],(w) mediante 

fuW = fr[h~\u)] 


dh~ l 

du 


Ejercicios 

6.23 En el Ejercicio 6.1 consideramos una variable aleatoria Y con funcion de densidad de probabilidad dada 
por 

= pa-y), 0<y<l, 

( 0, en cualquier otro punto, 

y empleamos el metodo de las funciones de distribucion para determinar las funciones de densidad de 
a Ui = 2Y - 1. 
b U 2 = 1~2Y. 

C U 3 = Y 2 . 

Use el metodo de las transformaciones para hallar las densidades de U l , U 2 y C/ 3 . 

6.24 En el Ejercicio 6.4, consideramos una variable aleatoria Y que posera una distribucion exponencial con 
media 4 y usamos el metodo de las funciones de distribucion para obtener la funcion de densidad para 
U = 3Y + 1. Utilice el metodo de las transformaciones para deducir la funcion de densidad para U. 

6.25 En el Ejercicio 6.11 consideramos dos componentes electronicos que operan de modo independiente, 
cada uno con vida util gobernada por la distribucion exponencial con media 1. Procedimos a usar el 
metodo de las funciones de distribucion para obtener la distribucion del promedio de vida util para los 
dos componentes. Utilice el metodo de las transformaciones para obtener la funcion de densidad para el 
promedio de vida util de los dos componentes. 
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6.26 La funcion de densidad de Weibull esta dada por 

I -rny m ~ l e~ ym/a , y > 0, 

0, en cualquier otro punto, 

donde a y m son constantes positivas. Esta funcion de densidad se usa con frecuencia como modelo para 
la vida util de sistemas fisicos. Suponga que Y tiene la densidad de Weibull dada. Encuentre 

a la funcion de densidad de U = Y"'. 
b E(Y k ) para cualquier entero positivo k. 

6.27 Sea Y que tiene una distribucion exponencial con media /3. 

a Demuestre que W = \fY tiene una densidad de Weibull con a = /3 y m — 2. 
b Use el resultado del Ejercicio 6.26(b) para deducir E(Y k / 2 ) para cualquier entero positivo k. 

6.28 Sea Y con una distribucion uniforme (0, 1). Demuestre que U = -2 ln(D tiene una distribucion exponen¬ 
cial con media 2. 

6.29 La velocidad de una molecula en un gas uniforme en equilibrio es una variable aleatoria V cuya funcion 
de densidad esta dada por 


/(v) = av 2 e bv2 , v > 0, 


donde b = m/2kT y k, T y m denotan la constante de Boltzmann, la temperatura absoluta y la masa de 
la molecula, respectivamente. 

a Deduzca la distribucion de W = mV 2 /2, la energfa cinetica de la molecula. 
b Encuentre E( W). 

6.30 Una corriente electrica fluctuante / puede ser considerada una variable aleatoria uniformemente distri- 
buida en el intervalo (9, 11). Si esta corriente pasa por un resistor de 2 ohms, encuentre la funcion de 
densidad de probabilidad de la potencia P = 2 1 2 . 

6.31 La distribucion conjunta para la vida util de dos diferentes tipos de componentes que operan en un sis- 
tema se determino en el Ejercicio 5.18 por 


/O’ i. yi) 


(l/8)yie (« + -V 2 )/ 2 5 y l > o, y 2 > 0, 

0, en cualquier otro punto. 


La eficiencia relativa de los dos tipos de componentes esta medida por U = Y 2 /Y i . Encuentre la funcion 
de densidad de probabilidad para U. 

6.32 En el Ejercicio 6.5 consideramos una variable aleatoria Y que tiene una distribucion uniforme en el 
intervalo [1. 5], El costo de demora esta dado por U = 2 Y 2 + 3. Use el metodo de las transformaciones 
para obtener la funcion de densidad de U. 

6.33 La proportion de impurezas en ciertas muestras de mineral es una variable aleatoria Y con funcion de 
densidad dada por 


/ O) 


(3/2)y 2 + y, 0 < y < 1, 

0, en cualquier otro punto. 


El valor en dolares de esas muestras es U = 5 — (Y/2). Encuentre la funcion de densidad de probabili¬ 
dad para U. 
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6.34 


Una funcion de densidad que a veces utilizan ingenieros para modelar duraciones de vida util de com- 
ponentes electronicos es la densidad de Rayleigh, dada por 


f(y) = 




y >0, 


0, en cualquier otro punto. 

a Si Y tiene la densidad de Rayleigh, encuentre la funcion de densidad de probabilidad para U = Y 2 . 
b Utilice el resultado del inciso a para hallar E(Y) y V(Y). 


6.35 Sean fj y Y 2 variables aleatorias independientes, ambas uniformemente distribuidas en (0, 1). Encuentre 
la funcion de densidad de probabilidad para U = Y 1 Y 2 . 

6.36 Consulte el Ejercicio 6.34. Sean Y } y Y 2 variables aleatorias independientes con distribution de Rayleigh. 
Encuentre la funcion de densidad de probabilidad para U = Y\ + Y\. [Sugerencia: recuerde el Ejemplo 
6 . 8 .] 


6.5 Metodo de las funciones generadoras 
de momento 

El metodo de las funciones generadoras de momento para determinar la distribution de pro¬ 
babilidad de una funcion de variables aleatorias Y v Y 2 , , Y n esta basada en el siguiente 

teorema de unicidad. 


TEOREMA 6.1 Denotemos con m x ( t ) y m Y (f) las funciones generadoras de momento de variables aleato¬ 

rias X y Y, respectivamente. Si existen funciones generadoras de momento y m x (t) = m Y {t) 
para todos los valores de t, entonces X y Y tienen la misma distribution de probabilidad. 


(La demostracion del Teorema 6.1 esta fuera del alcance de este libro.) 

Si U es una funcion de n variables aleatorias Y v Y 2 , , Y n , el primer paso al usar el 

Teorema 6.1 es hallar la funcion generadora de momento de U: 

m v (t) = E(e' u ). 

Una vez determinada la funcion generadora de momento para U, se compara con las funciones 
generadoras de momento para variables aleatorias con distribuciones bien conocidas. Si m^t) 
es identica a una de estas, por ejemplo la funcion generadora de momento para una variable 
aleatoria V, entonces, por el Teorema 6.1, U y V poseen distribuciones de probabilidad identi- 
cas. Las funciones de densidad, medias, varianzas y funciones generadoras de momento para 
algunas variables aleatorias que se encuentran con frecuencia se presentan en el Apendice 2. 
Ilustraremos el procedimiento con unos pocos ejemplos. 


EJEMPLO 6.10 


Sea Y una variable aleatoria normalmente distribuida con media /j. y varianza cr 2 . Demuestre 
que 


a 


tiene una distribution normal estandar, una distribution normal con media 0 y varianza 1. 
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Solucion Hemos visto en el Ejemplo 4.16 que Y — /jl tiene funcion generadora de momenta e r “ 2 / 2 . Por 
tanto, 

m z {t) = E(e ,z ) = £[ e 6/^)d'-ta] = = // 2 . 

A1 comparar m 7 (t) con la funcion generadora de momento de una variable aleatoria normal, 
vemos que Z debe estar normalmente distribuida con E(Z) = 0 y V(Z) = 1. ■ 


EJEMPLO 6.11 Sea Z una variable aleatoria normalmente distribuida con media 0 y varianza 1. Use el metodo de 
las funciones generadoras de momento para determinar la distribucion de probabilidad de Z 2 . 


Solucion La funcion generadora de momentos para Z 2 es 


m z i{t) = E(e ,z ) = / e n f(z)dz = 


i: 

/: 


/ oo 

-oo 


2 e 


-z 2 /2 


V27 t 


dz 


. V27r 


-(z 2 /2)(l-2 1) 


dz- 


Esta integral se puede evaluar ya sea consultando una tabla de integrates o tomando en cuenta 
que, si 1 — 2f > 0 (de manera equivalente, t < 1/2), el integrando 



/z 2 \ 1 

r 

exp 


exp 




\/2t7 


\Z2tt 


es proporcional a la funcion de densidad de una variable aleatoria normalmente distribuida 
con media 0 y varianza (1 — 2f) -1 . Para hacer del integrando una funcion de densidad normal 
(para que la integral definida sea igual a 1), multiplicamos el numerador y denominador por la 
desviacion estandar, (1 — 2f)” 1 / 2 . Entonces 


m z i(t) = 


L 


(1 — 2r) 1 / 2 y-ooV^d — 2f) -1 / 2 


exp 


Como la integral es igual a 1, si t < 1/2, 


m z i{t) = 


1 


(1 — 2 t ) 1 / 2 


= d-20 


-1/2 


j (1 — 2f) -1 dz. 


Una comparacion de ni 7 i(t) con las funciones generadoras de momento del Apendice 2 
muestra que m z i(t) es identica a la funcion generadora de momento para la variable aleatoria 
con distribucion gamma y a= 1 /2 y (3 = 2. Asl, usando la Definicion 4.10, Z 2 tiene una dis¬ 
tribucion x 2 con v = 1 grado de libertad. Se deduce que la funcion de densidad para U = Z 2 
esta dada por 


[ M - V 2 e -«/2 

/£/(«) = ] r(i/2)2 1 / 2 ’ u ~ 0, 

[ 0, en cualquier otro punto. ■ 
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TEOREMA 6.2 


Demostracion 


EJEMPLO 6.12 


Solucion 


El metodo de las funciones generadoras de momento es con frecuencia muy util para hallar 
las distribuciones de sumas de variables aleatorias independientes. 

Sean Y X ,Y 2 , ... ,Y n variables aleatorias independientes con funciones generadoras de 
momento m Yl (t), m Y2 (t),..., m Yn (t), respectivamente. Si U = Tj + Y 2 + ■ ■ ■ + Y n , 
entonces 

= m Yl (t) X m Yl (t) X- • -X m Yn (t). 

Sabemos que, como las variables aleatorias Y t , Y 2 ,... , Y n son independientes (vea el 
Teorema 5.9), 

mu (t) = +•■•+«] = E(e tY 'e ,Y '-- ■e tY ■) 

= E(e ,Y ') X E(e ,Yl ) X • • • X E(e tY "). 

Entonces, por la definicion de funciones generadoras de momentos, 

niu(t) = m Yl (t ) X m Yl (t ) X • • • X m Yn (t). 


La cantidad de clientes que llegan a una caja para pagar en un intervalo determinado de tiempo 
posee aproximadamente una distribucion de probabilidad de Poisson (vea la Section 3.8). Si 
fj denota el tiempo que transcurre hasta la primera llegada, Y 2 denota el tiempo entre la pri- 
mera y la segunda llegadas, . . . , y Y n denota el tiempo entre la llegada del primer (n — 1) 
cliente y la n-esima llegada, entonces se puede demostrar que Y v Y 2 , . . . , Y n son variables 
aleatorias independientes, con la funcion de densidad para Y t dada por 


fy,(yd 


-e~ yile , y, > 0, 

0 

0, en cualquier otro punto. 


[Como las variables Y p para i = 1,2,...,;;, estan distribuidas exponencialmente, se deduce 
que EiY) = 0; esto es, 6 es el tiempo promedio que transcurre entre llegadas.] Encuentre la 
funcion de densidad de probabilidad para el tiempo de espera desde que se abre la caja de sa- 
lida hasta que llega el n-esimo cliente. (Si Y x , Y 2 ,... denotan tiempos sucesivos entre llegadas, 
buscamos la funcion de densidad de U = fj + Y 2 + ■ ■ ■ + Y n .) 


Para aplicar el Teorema 6.2 debemos conocer primero m Y .(t), i = 1.2,..., n. Como cada 
una de las Y : esta distribuida exponencialmente con media 0, m Yj (t) = (1 — Ot) 1 y, por el 
Teorema 6.2, 


mjj(t) = m Yl (t) X m Yl (t) X • • • X m Yn (t ) 


= (i - ety 1 x (i - ety 1 x • • • x (i - oty 1 = (i - oty n . 


Esta es la funcion generadora de momento de una variable aleatoria con distribucion gamma 
y a= n y [1 = 6. El Teorema 6.1 implica que U en realidad tiene esta distribucion gamma y 
por tanto que 


fu(u ) 


-( u n ~ l e~ ule 

T (n)0» 

0 , 


). 


u > 0, 


en cualquier otro punto. 
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El metodo de las funciones generadoras de momento se puede usar para establecer algunos 
resultados utiles e interesantes acerca de las distribuciones de funciones de variables alea- 
torias normalmente distribuidas. Como estos resultados se usaran en los Capftulos 7-9, los 
presentamos en la forma de teoremas. 


TEOREMA 6.3 


Demostracion 


TEOREMA 6.4 


Sean Y v Y 2 , . . . ,Y n variables aleatorias independientes normalmente distribuidas con 
E(Yj) = fi t y V<Ti) = erf, para i = 1, 2,. .. , n, y sean a v a 2 , ■ ■ ■ , a n constantes. Si 

n 

U = T,a, E = a\Y\ + a 2 Y 2 + • • • +a n Y n , 

1=1 

entonces U es una variable aleatoria normalmente distribuida con 

n 

E(U ) = £>/,, = ai/jii + a 2 fi 2 + ■ ■ ■ + a n ii n 

;=i 

Y 

V(U) = y,ajcrf = a\(j\ + + ■ ■ ■ + a 2 n a^. 

i = 1 

Como Y i esta normalmente distribuida con media yu, ; y varianza of, Y i tiene funcion ge- 
neradora de momento dada por 

= ex P + 

[Recuerde que exp(-) es una forma mas comoda de escribir e { ' ] cuando el termino en el 
exponente es largo o complejo.] Por tanto, a i Y i tiene funcion generadora de momento 
dada por 

m aiYi (t ) = E(e ““ Yi ) = m Yi (ait ) = exp + 

Debido a que las variables aleatorias Y i son independientes, las variables aleatorias a t Y t 
son independientes, para i = 1, 2, . . . , n, y el Teorema 6.2 implica que 

mu(t) = m aiYl {t) X m a 2 y 2 (t) X • ■ • X 

/ aloft 2 \ 

= exp I fiiait + —-— IX--- 

( n j 2 n 

tyaiHi + yafo 2 

i = 1 Z i = 1 

Entonces, U tiene una distribucion normal con media Y^=\ a il JL i Y varianza ^" =1 afof. 




ahyy 









322 Capltulo 6 Funciones de variables aleatorias 


Demostracion 


6.37 


6.38 


6.39 


Como Y i esta normalmente distribuida con media /j, ( y varianza of, el resultado del 
Ejemplo 6.10 implica que Z ; esta normalmente distribuida con media 0 y varianza 1. 
Del Ejemplo 6.11, entonces tenemos que Zj es una variable aleatoria con distribucion 
X 2 con 1 grado de libertad. En consecuencia, 

m zf (t) = (1 - 2tr 1/2 , 

y del Teorema 6.2, con V = = i Z 2 , 

m v (t ) = m 7 2 (t) X m z i(t) X • • • X m Z 2 (f) 

= (1 - 2f) 1/2 X (1 - 2t)” 1/2 X ■ • ■ X (1 - 2 r)“ 1/2 = (1 - 2ty n/2 . 

Como las funciones generadoras de momento son unicas, V tiene una distribucion x 2 
con n grados de libertad. 


El teorema 6.4 proporciona alguna aclaracion de los grados de libertad asociados con una 
distribucion x~- Si n es independiente, las variables aleatorias normales estandar se elevan al 
cuadrado y se suman y el resultado tiene una distribucion x 2 con n grados de libertad. 


Resumen del metodo de las funciones generadoras de momento 

Sea U una funcion de las variables aleatorias Y u Y 2 ,..., Y n . 

1. Encuentre la funcion generadora de momento para U, 

2. Compare m l; (t) con otras funciones generadoras de momento bien conocidas. Si 
m 6 ,(t) = m v (t) para todos los valores de f, el Teorema 6.1 implica que U y V tienen 
distribuciones identicas. 


Ejercicios 

Sean Y u Y 2 ,..., Y n variables aleatorias independientes e identicamente distribuidas tales que para 0 < p 
< 1, P{Y i = 1) = p y P{Y t = 0) = <y=l -p. (Tales variables aleatorias reciben el nombre de variables 
aleatorias de Bernoulli.) 

a Encuentre la funcion generadora de momento para la variable aleatoria Y { de Bernoulli, 
b Encuentre la funcion generadora de momento para W = Y 1 + Y 2 + • ■ • + Y n . 
c ^Cual es la distribucion de IT? 

Sean Fj y Y 2 variables aleatorias independientes con funciones generadoras de momento my l (t) y my 2 (t), 
respectivamente. Si y a, son constantes, y U = a 1 Y l + a 2 T> demuestre que la funcion generadora de 
momento para U es m v (t) = m Yl {ap) X m Yl {a 2 t). 

En los Ejercicios 6.11 y 6.25 consideramos dos componentes electronicos que operan independiente- 
mente, cada uno con una vida util gobemada por la distribucion exponencial con media 1. Use el metodo 
de las funciones generadoras de momento para obtener la funcion de densidad para el promedio de vida 
util de los dos componentes. 
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6.40 Suponga que fj y Y 2 son variables aleatorias normales estandar e independientes. Encuentre la funcion 
de densidad de U — Yf + Y 2 . 

6.41 Sean Y lt Y 2 ,.. ., Y n variables aleatorias normales e independientes, cada una con media /x y varianza cr 2 . 
Denote con a v a 2 , . . . , a n constantes conocidas. Encuentre la funcion de densidad de la combination 
lineal U = J2"=\ a,-7). 

6.42 Un tipo de elevador tiene una capacidad maxima de peso Y v que esta normalmente distribuida con me¬ 
dia de 5000 libras y desviacion estandar de 300 libras. Para un cierto edificio equipado con este tipo de 
elevador, la carga del elevador, Y 2 , es una variable aleatoria normalmente distribuida con media de 4000 
libras y desviacion estandar de 400 libras. Para cualquier tiempo determinado en el que el elevador esta 
en uso, calcule la probabilidad de que sea sobrecargado, suponiendo que Y 1 y Y 2 son independientes. 


6.43 Consulte el Ejercicio 6.41. Sean 7,, Y 2 ,..., Y n variables aleatorias normales e independientes, cada una 
con media /jl y varianza a 2 . 


- 1 

a Encuentre la funcion de densidad de Y = — > Y,. 

n 7~t 

b Si cr 2 = 16 y n = 25, ^cual es la probabilidad de que la media muestral, Y, tome un valor que este a 
no mas de una unidad de la media poblacional, /u? Esto es, encuentre P(| y-/x|<D. 

c Si cr 2 = 16, encuentre P(\Y — /jl\ £ 1) si n = 36, n — 64 y n = 81. Interprete los resultados de sus 
calculos. 


*6.44 El peso (en libras) de sandfas de “tamano mediano” esta normalmente distribuido con media de 15 y 
varianza de 4. Un recipiente de empaque para varias sandfas tiene una capacidad nominal de 140 libras. 
),Cual es el numero maximo de sandfas que deben ponerse en un solo recipiente de empaque si el lfmite 
de peso nominal debe excederse solo el 5% del tiempo? Justifique su respuesta. 

6.45 El gerente de una obra de construccion necesita hacer una cotizacion de precios con todo cuidado antes 
de presentar un presupuesto. Tambien necesita tomar en cuenta la incertidumbre (variabilidad) en las 
cantidades de productos que podrfa necesitar. Para simplificar al maximo la situation real, suponga 
que un gerente de proyectos representa la cantidad de arena, en yardas, necesaria para un proyecto de 
construccion como si fuera una variable aleatoria Y v que esta normalmente distribuida con media de 10 
yardas y desviacion estandar de .5 yarda. La cantidad de mezcla de cemento necesaria, en cientos de li¬ 
bras, es una variable aleatoria Y 2 que esta normalmente distribuida con media de 4 y desviacion estandar 
.2. La arena cuesta $7 por yarda, y la mezcla de cemento cuesta $3 por cien libras. Sumando $100 por 
otros costos, el gerente calcula que su costo total es 


U = 100 + 77j + 3 Y 2 . 

Si 7j y Y 2 son independientes, (,que presupuesto debe presentar el gerente para asegurar que los costos 
reales rebasaran la cantidad cotizada con una probabilidad de solo .01? ),En este caso es razonable la 
suposicion de independencia? 

6.46 Suponga que Y tiene una distribution gamma con a = n/2 para algun entero positivo n y fi igual a algun 
valor especificado. Use el metodo de las funciones generadoras de momento para demostrar que W = 
2 Y//3 tiene una distribution x 2 con n grados de libertad. 

6.47 Una variable aleatoria Y tiene una distribution gamma con a = 3.5 y /3 = 4.2. Use el resultado del 
Ejercicio 6.46 y los puntos porcentuales para las distribuciones x 2 dadas en la Tabla 6, Apendice 3, para 
hallar P(Y > 33.627). 

6.48 En un programa de prueba de misiles, una variable aleatoria de interes es la distancia entre el punto 
de impacto del misil y el centro del bianco al que fue dirigido el misil. Si consideramos el centra del 
bianco como el origen de un sistema de coordenadas, podemos denotar con Y t la distancia norte-sur 
entre el punto de impacto y el centro del bianco y denotar con Y 2 la correspondiente distancia este-oeste. 
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(Suponga que norte y este definen direcciones positivas.) La distancia entre el punto de impacto y el 
centra del bianco es entonces U — Jy\ + 7, 2 . Si 7, y 7, son variables aleatorias normales estandar e 
independientes, encuentre la funcion de densidad de probabilidad para U. 

6.49 Sea Y 1 una variable aleatoria binomial con n l intentos y probabilidad de exito dada por p. Sea Y 2 otra 
variable aleatoria binomial con n 2 intentos y probabilidad de exito tambien dada por p. Si 7 t y 7, son 
independientes, encuentre la funcion de probabilidad de 7j + Y 2 . 

6.50 Sea Y una variable aleatoria binomial con n intentos y probabilidad de exito dada por p. Demuestre que 
n - Yes una variable aleatoria binomial con n intentos y probabilidad de exito dada por 1 -p. 

6.51 Sea 7j una variable aleatoria binomial con n, intentos y p x = .2 y sea Y 2 una variable aleatoria binomial 
independiente con n, intentos y p 2 = .8. Encuentre la funcion de probabilidad de Y t + n 2 - Y 2 . 

6.52 Sean 7 t y Y 2 variables aleatorias de Poisson independientes con medias \ l y A 2 , respectivamente. 
Encuentre 

a la funcion de probabilidad de 7 t + 7 2 , 

b la funcion de probabilidad condicional de 7,, dado que Y 1 + Y 2 = m. 

6.53 Sean 7,, 7 2 , . . . , Y n variables aleatorias binomiales independientes con n t intentos y probabilidad de 
exito dada por p p =1,2,..., n. 

a Si todas las n i son iguales y todas las p son iguales, encuentre la distribucion de J^" =1 7,. 
b Si todas las n i son diferentes y todas las p son iguales, encuentre la distribucion de ^" =] 7 y . 

c Si todas las n t son diferentes y todas las p son iguales, encuentre la distribucion condicional Y 1 dado 

q ue E"=i K = m. 

d Si todas las n, son diferentes y todas las p son iguales, encuentre la distribucion condicional 7j + 7 2 
dado que Y^=i Y ~ m - 

e Si todas las p son diferentes, ^,el metodo de las funciones generadoras de momento funciona bien para 
encontrar la distribucion de £]" =1 Yf! ^Por que? 

6.54 Sean 7j, 7 2 , . . . , Y n variables aleatorias independientes de Poisson con medias A 1; A 2 , . . . , A„, respecti¬ 
vamente. Encuentre 

a la funcion de probabilidad de ^" =1 7;. 

b la funcion de probabilidad condicional de 7j, dado que ^" =| Y t = m- 

c la funcion de probabilidad condicional de 7 t + 7 2 , dado que YH= i Y, — m. 

6.55 Llegan clientes a la caja de una tienda departamental de acuerdo con una distribucion de Poisson, 
con media de 7 por hora. En un periodo determinado de dos horas, ^cual es la probabilidad 
de que 20 o mas clientes lleguen a la caja? 

6.56 El tiempo necesario para afinar un automovil esta exponencialmente distribuido con una media de .5 
hora. Si dos autos estan en espera de una afinacion y los tiempos de servicio son independientes, ^.cual 
es la probabilidad de que el tiempo total para afinar los dos automoviles sea mayor que 1.5 horas? 
[Sugerencia: recuerde el resultado del Ejemplo 6.12.] 

6.57 Sean Y 1 , 7 2 , . . . , Y n variables aleatorias independientes tales que cada Y i tiene una distribucion gamma 
con parametros a t y /?. Esto es, las distribuciones de las 7 podrfan tener diferentes a , pero todas tienen 
el mismo valor para j3. Demuestre que U = Y l + Y 2 + ■ ■ ■ + Y n tiene una distribucion gamma con pa¬ 
rametros a l + a 2 + ■ ■ ■ + a n y p. 

6.58 Vimos en el Ejercicio 5.159 que la variable aleatoria binomial negativa 7 se puede escribir como 

7 = Wj, donde VFj, W^, . . . ,W r son variables aleatorias geometricas independientes con parame- 

tro p. 
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a Use este dato para obtener la funcion generadora de momento para F. 

b Use la funcion generadora de momento para demostrar que E(Y) = r/p y V(Y) = r(] — p)/p 2 . 
c Encuentre la funcion de probabilidad condicional para W 1 , dado que Y = W 1 + W 2 + ■ ■ ■ + W r = m. 

6.59 Demuestre que si F t tiene una distribucion x~ con v l grados de libertad y Y 2 tiene una distribucion \ 2 
con v 2 grados de libertad, entonces U = F t + Y 2 tiene una distribucion x 2 con v l + v 2 grados de libertad, 
siempre que Fj y Y 2 sean independientes. 

6.60 Suponga que W = Y 1 + Y 2 donde Y { y Y 2 son independientes. Si W tiene una distribucion x 2 con v grados 
de libertad y W t tiene una distribucion x~ con v 1 < v grados de libertad, demuestre que Y 2 tiene una 
distribucion x 2 con v - v l grados de libertad. 

6.61 Consulte el Ejercicio 6.52. Suponga que W = F t + F, donde Y j y Y 2 son independientes. Si W tiene una 
distribucion de Poisson con media A y W 1 tiene una distribucion de Poisson con media Aj < A, demues¬ 
tre que Y 2 tiene una distribucion de Poisson con media A - Aj. 

*6.62 Sean Fj y Y, variables aleatorias normales independientes, cada una con media 0 y varianza cr 2 . Defina 
U 1 = Y l + Y 2 y U-, = F[ — Y 2 . Demuestre que U t y U-, son variables aleatorias normales independientes, 
cada una con media 0 y varianza 2a 2 . [Sugerencia: si (U v U 2 ) tiene una funcion generadora de momento 
conjunta m(t u t 2 ), entonces Uj y U 2 son independientes si y solo si m(t\, tY) — rnu, (t\)mrj 2 (t 2 ).\ 


6.6 Transformaciones multivariantes 
usando jacobianos (opcional) 


Si Y es una variable aleatoria con funcion de densidad/ v /v), el metodo de las transformaciones 
(Seccion 6.4) se puede usar para determinar la funcion de densidad para U = h(Y), siempre 
que h(y) sea creciente o decreciente para toda y tal que / K (y) > 0. Si h(y) es creciente o de- 
creciente para toda y en el soporte de f Y (y), la funcion h(-) es uno a uno y existe una funcion 
inversa /r'(-) tal que u = h '(yj. Ademas, la funcion de densidad para U esta dada por 


fuW 


fy(h-\u)) 


dh 1 (u) 
du 


Suponga que Y t y Y 2 son variables aleatorias continuas conjuntas y que U { = Y 1 + Y 2 y U 2 = 
F, - Y 2 . qComo podemos determinar la funcion de densidad conjunta de U l y U 2 1 

En el resto de esta seccion expresaremos la densidad conjunta de F, y Y 2 como 
f Vl ,Y 2 (y\ , >’ 2 ) ■ Extendiendo las ideas de la Seccion 6.4, el soporte de la densidad conjunta 
/u.uOi» F 2 ) es e l conjunto de todos los valores de (y l? y 2 ) tales que f Y ,r 2 (yi, >' 2 ) > 0. 


Metodo de las transformaciones bivariadas 

Suponga que K, y Y 2 son variables aleatorias continuas con funcion de densidad conjun- 

ta /ri,y 2 (Ft, F 2 ) y que toda Cfi, >' 2 ) tal que f Yl ,Y 2 (yu yi) > 0. 

Mj = h 1 (y 1 , y 2 ) y u 2 = h 2 (y v y 2 ) 
es una transformacion uno a uno de (y,, y 2 ) y (u v u 2 ) con inversa 

yi = u 2 ) y yi = h 2 \u 1 , m 2 ). 
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EJEMPLO 6.13 


Solution 


Si h j *(m i, m 2 ) y /r 2 *(mi, m 2 ) tienen derivadas parciales continuas con respecto a u l y m-, 
yjacobiano 


7 = det 


3/ij 1 

3m 1 
3/i^ 1 
3 mj 


3/z^ 1 

3«2 

3/r^ 1 

3m 2 


3/jj 1 3 h 2 1 

3mi 3m 2 


dh 2 1 3/rj 1 
3r<i 3 m 2 


^ 0, 


entonces la densidad conjunta de U 1 y U 2 es 

fUi,Ul( u l’ M 2) = fYi,Y2 (^1 '( M l> M 2). h 2 '(Mi, M 2 )) I y I, 

donde |/| es el valor absoluto del jacobiano. 


No demostraremos este resultado, pero se deduce de resultados de calculo empleados para 
cambio de variables en la integration multiple. (Recuerde que a veces es mas facil calcular las 
integrates dobles si usamos coordenadas polares en lugar de coordenadas euclidianas; vease 
el Ejercicio 4.194.) El valor absoluto del jacobiano, |/|, en la transformation multivariante es 
analogo a la cantidad \dh *(m) /du\ que se usa cuando se hace la transformation de una variable 
U = h(Y). 

Advertencia. Es necesario asegurarse que la transformacion bivariante Mj = y 2 ), 

u 2 = h 2 (y l , y 2 ) es una transformacion biumvoca para toda (y p y 2 ) tal que fy u Yi (yi, yi) > 0. 
Es frecuente omitir este paso. Si la transformacion bivariante no es biumvoca y este metodo 
se aplica a ciegas, la funcion resultante de “densidad” no tendra las propiedades necesarias de 
una funcion de densidad valida. Ilustramos el uso de este metodo en los ejemplos siguientes. 


Sean Y 1 y Y 2 variables aleatorias normales estandar independientes. Si U t = + Y-, y U 2 = 

Y y — Y 2 , entonces U l y U 2 son combinaciones lineales de variables aleatorias normalmente 
distribuidas e independientes, y el Teorema 6.3 implica que U l esta normalmente distribuida 
con media 0 + 0 = 0 y varianza 1 + 1=2. Del mismo modo, Uj tiene una distribution nor¬ 
mal con media 0 y varianza 2. ( ' Cual es la densidad conjunta de U { y U 2 1 


Las funciones de densidad Y t y Y 2 son 


/i(yi) 


e -d/2)y? 

\/2tt 


hiyi) 


e -(l/2)y| 

\/2lT 


—00 < y\ < 00 


—00 < y 2 < 00 , 


y la independencia de fj y Y 2 implica que la densidad conjunta de ambas es 


e -(l/2)yf-(l/2)y| 

fY,,Y 2 (yu yf) = ---, -00 < yi < 00 , -00 < y 2 < 00 . 

27 T 

En este caso, fY l ,Y 2 (y 1 , yf) > 0 para toda -00 < < 00 y -00 <y 2 < 00 , y estamos intere- 

sados en la transformacion 


u\ = y\ + yi = hi(yi,y 2 ) y u 2 = yi - yi = h 2 (yi, yi) 
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EJEMPLO 6.14 


con transformation inversa 


}’i = (mi + m 2 )/2 = h l '(«!, u 2 )yyi = («i - m 2 )/2 = h 2 \u u u 2 ). 


Como 3/?j '/3 mi = 1/2, 3/?j '/3 m 2 = 1/2, 3/r 2 1 /3 mi = 1/2 y 3 h 2 1 /3m 2 = —1/2, el jacobiano 
de esta transformation es 


J = det 


- 1/2 

. 1/2 


1 / 2 - 

- 1 / 2 . 


(1/2X-1/2) - (l/2)(l/2) 


- 1/2 


y la densidad conjunta de U l y U 2 es [con exp(-) = e ( ) ] 


,/t/i,t / 2 (m i , m 2 ) - 


exp 


_ 1 / U\ +U2 _ 1 / U i —112 

2 \ 2 / 2 V 2 / 


277 


Un poco de algebra nos dara como resultado 


1 (U\ + U2\ 1 (U\ ~ U2 

2 


-- 


1 

2 


—oo < (w i + m 2 )/2 < oo, 
—oo < (m i — m 2 )/2 < oo. 


2 




2 

2 


y 


{(mi, ^^ 2 ): —oo < (mi + m 2 )/2 < oo, —oo < (mi — m 2 )/2 < oo} 
= {(m ! , r/ 2 ) : —OO < M ! < oo, —oo < m 2 < oo}. 


Finalmente, como 4-77 = V2 V27r V2A/27r. 


g-«?/ 4 e ~«2/ 4 

/(/, D)(Hl, H 2 ) = “F—^—00<Mi<00, —00 <M 2 <00. 

V2\2tt\2\2tt 


Observe que C/ x y son independientes y normalmente distribuidas, ambas con media 0 y 
varianza 2. jLa information extra dada por la distribucion conjunta de U { y U 2 es que las dos 
variables son independientes! ■ 


El metodo de las transformaciones multivariantes tambien es util si estamos interesados en 
una sola funcion de K, y Y 2 , por ejemplo, U 1 = h(Y v Y 2 ). Como tenemos solo una funcion de 
7, y y 2 , podemos usar el metodo de transformaciones bivariantes para hallar la distribution 
conjunta de U l y otra funcion U 2 = h 2 {Y v Y 2 ) y en seguida determinar la densidad marginal 
deseada de U l al integral - la densidad conjunta. Debido a que estamos interesados realmente 
solo en la distribucion de U v generalmente escogerfamos la otra funcion U 2 = h 2 ( Y v Y 2 ) para 
que la transformation bivariante sea facil de invertir y sea sencillo trabajar con el jacobiano. 
Ilustramos la aplicacion de esta tecnica en el siguiente ejemplo. 


Sean lj y Y 2 variables aleatorias exponenciales independientes, ambas con media (3 > 0. 
Encuentre la funcion de densidad de 


U = 


Y i 

Ft + y 2 ' 
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Solucion 


Las funciones de densidad para Y x y Y 2 son, de nuevo usando exp(-) = e ( '\ 


y 


/Kyi) 


^exp(-yi//3), 

0, 


0 < y i, 

en cualquier otro punto. 


hiyi) 


l 

-exp(-y 2 //3), 

0, 


0 < >'2, 

en cualquier otro punto. 


Su densidad conjunta es 


/ri,y 2 (yi’ >’2) 


^exp[-(yi + y 2 )//3], 0 < yi, 0 < y 2 , 

0, en cualquier otro punto. 


porque Fj y Y 2 son independientes. 

En este caso, fy lt y 2 (yi, y 2 ) > 0 para toda (y ,, y 2 ) tal que 0 < y,, 0 < y 2 , y estamos intere- 
sados en la funcion U 1 = Y l /(Y l + L 2 ). Si consideramos la funcion m, = + y 2 ), obvia- 

mente hay muchos valores para (y u y 2 ) que daran el mismo valor para u ,. Definamos 


«i = —-— = h i(yt, y 2 ) y u 2 = yi + y 2 = h 2 (y u y 2 ). 
yi + yi 

Elegir esta opcion de u 2 da como resultado una transformacion inversa adecuada: 

yi = u\u 2 = u 2 ) y y 2 = u 2 {\ - u\) = h 2 x {u\, u 2 ). 


El jacobiano de esta transformacion es 


J = det 


u 2 


—u 2 


U 1 

1 — U\ 


w 2 (l - Ml) - (-M 2 )(Mi) = M 2 , 


y la densidad conjunta de U { y U 2 es 
fuuu 2 (uu m 2 ) 


^-expi- 


«iM 2 + n 2 (l - Mi)] //3 }|m 2 | , 


0 < U\U 2 , 0 < m 2 (1 — Ml), 


0, en cualquier otro punto. 

En este caso/^, y (m 1; m 2 ) > 0 si u x y m 2 son tales que 0 < MjM 2 0 < m 2 (1 -m^. Observe que 
si 0 < Mj m 2 , entonces 

0 < m 2 (1 — Ml) = m 2 — MiM 2 0 < M|u 2 < u 2 <^> 0 < Mi < 1. 


Si 0 < M; < 1, entonces 0 < n 2 ( 1 - m, ) implica que 0 < m 2 . Por tanto, la region de soporte para 
la densidad conjunta de U l y U 2 es {(m I; m 2 ): 0 < u l < 1, 0 < m 2 ], y la densidad conjunta de 
U x y U 2 esta dada por 


fu\,u 2 (m 1 •> m 2 ) 


I 


0 < Ml < 1, 0 < m 2 , 

en cualquier otro punto. 


Usando el Teorema 5.5 se ve facilmente que U { y U 2 son independientes. Las densidades 
marginales de U l y U 2 se pueden obtener al integrar la densidad conjunta que se obtuvo antes. 
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En el Ejercicio 6.63 usted demostrara que Lj esta uniformemente distribuida en (0, 1) y que 
Lj tiene una densidad gamma con parametros a = 2 y [3. ■ 


La tecnica descrita en esta seccion se puede ver como una version de un paso del proceso 
de dos pasos ilustrado en el Ejemplo 6.9. 

En el Ejemplo 6.14 fue mas diffcil hallar la region de soporte (donde la densidad conjunta 
es positiva) que la ecuacion de la funcion de densidad conjunta. Como veremos en el ejemplo 
y ejercicios siguientes, con frecuencia este es el caso. 


EJEMPLO 6.15 


En el Ejemplo 6.9, consideramos las variables aleatorias lj y Y 2 con funcion de densidad 
conjunta 


fruYiiyi, Y2) 


2(1 - yO, 0 < yi < 1, 0 < y 2 ^ 1, 

0, en cualquier otro punto, 


y nos interesaba TJ = lj lj. Encuentre la funcion de densidad de probabilidad para U usando 
el metodo de transformacion bivariante. 


Solucion En este caso /ri,y 2 ()'i> Yi) > 0 para toda (jy x , y 2 ), tales que 0 < y t < l,0sy 2 < 1, y estamos 
interesados en la funcion U 2 = lj Y 2 . Si consideramos la funcion u 1 = yyy 2 , por si sola no es 
una funcion biunfvoca de las variables (y x , y 2 ). Considere 

ui = yi = hi(yu yi) y u 2 = >’i >’2 = h 2 (yi, yi)- 


Para esta eleccion de u v y 0 < y : ^ 1.0 < y 2 < 1, la transformacion de (y x , y 2 ) en (u v «,) es 
biunfvoca y 

yi = Ul = h^\uu U 2 ) y y 2 = u 2 /ui = h 2 \ui, u 2 ). 


J = det 


= ki/ M i ) - {-u 2 /u\m = i /»!. 


El jacobiano es 

1 0 
_—u 2 /u\ l/u\_ 

La variable original de interes es U 2 = K, Y 2 , y la densidad conjunta de Lj y Lj es 

1 


f \ _ J 2(1 - ui) 

fuuUziUi, U 2 ) — 


U 1 


, 0s«! <1, Os u 2 /ui s 1, 

0, en cualquier otro punto. 

Debido a que 

{(«!, u 2 y. 0 — ui — 1, 0 < u 2 /u\ £ 1} = {(ui, u 2 ): 0 s «2 — «i — 1}. 


la densidad conjunta de Lj y Lj es 


fui,Ui( u i’ u 2 ) 


1 

2(1— Ml) -, 0 < M2 ^ Ml < 1, 

Mi 


0, en cualquier otro punto. 

Esta densidad conjunta es exactamente igual que la densidad conjunta obtenida en el Ejemplo 
6.9 si identificamos las variables K, y U empleadas en el Ejemplo 6.9 con las variables Lj y 
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Z7,, respectivamente, usadas aquf. Con esta identificacion, la densidad marginal de U 2 es pre- 
cisamente la densidad de U obtenida en el Ejemplo 6.9, es decir. 


fiiui) 


2(u 2 — In M2 — 1 ), 0s« 2 sl, 

0, en cualquier otro punto. 


Si Y v Y 2 ,. . ., Y k son variables aleatorias continuas conjuntas y 

Ui = hi(Y u Y 2 ,..., Y k ), U 2 = h 2 (Y u Y 2 ,.... Y k ),..., U k = h k (Y u Y 2 ,..., Y k ), 
donde la transformacion 

mi = h\{yi, y 2 ,y k ), u 2 = h 2 (y u y 2 ,y k ),..., u k = h k (y u y 2 ,..., y k ) 


es una transformacion biunlvoca de (jq, y 2 , . . . , y k ) en (u v u 2 , . ■ ■ , u k ) con inversa 

>’i = hy l (uu u 2 ,..., u k ), y 2 = h^Cu u u 2 ,..., u k ),..., 
y k = h k 1 (u\, u 2 ,..., u k ), 

y u 2 ,..., u k ), h 2 \u u u 2 ,..., u k ),..., h k l (u\, u 2 ,..., u k ) tienen derivadas parcia- 

les continuas con respecto a rq, u 2 , . .., u k y jacobiano 


dh j 1 

dh; 1 

dh; 1 

du 1 

du 2 

du k 

dh 2 x 

dh 2 l 

dh; 1 

du 1 

du 2 

du k 

3* t 1 

d h k ' 


du\ 

du 2 

du k 


f 0, 


entonces se puede usar un resultado similar al presentado en esta seccion para determinar 
la densidad conjunta de U v U 2 , ■ ■ ■ , U k . Esto requiere calcular el determinante de una ma- 
triz k x k, este conocimiento no se requiere en el resto de este texto. Para mas detalles, vea 
“Bibliografra y lecturas adicionales” al final del capftulo. 


Ejercicios 


*6.63 


En el Ejemplo 6.14, Fj y Y 2 eran variables aleatorias independientes distribuidas exponencialmente, 
ambas con media [3. Definimos U 1 — Y^/iY^ + E 2 ) y U 2 — Y t + Y 2 y determinamos la densidad conjunta 
de (U 1 , U 2 ) corno 


/ui,c/ 2 ( M i’ “2) 


w U2e 


-112/0 


0 < U\ < 1 , 0 < U 2 , 

en cualquier otro punto. 


a Demuestre que U l esta uniformemente distribuida en el intervalo (0, 1). 
b Demuestre que U 2 tiene una densidad gamma con parametros a = 2 y /3. 
c Establezca que y U 0 son independientes. 
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*6.64 Consulte el Ejercicio 6.63 y el Ejemplo 6.14. Suponga que Fj tiene una distribution gamma con parame- 
tros aq y f5, que Y l tiene distribucion gamma con parametros a 2 y f), y que Y { y Y 2 son independientes. 
Sea U l = Fj/(Fj + Y 2 ) y U 2 = Y l + Y 2 . 

a Deduzca la funcion de densidad conjunta para U l y U 2 . 

b Demuestre que la distribucion marginal de U l es una distribucion beta con parametros aq y a 2 . 
c Demuestre que la distribucion marginal de U 2 es una distribucion gamma con parametros a = aq + 
a 2 y p. 

d Establezca que U 1 y U-> son independientes. 

6.65 Sean Z l y Z 2 variables aleatorias normales estandar independientes y U 1 = Zj y U 2 = Zj 4- Z 2 . 
a Deduzca la densidad conjunta de U l y U 2 . 

b Use el Teorema 5.12 para obtener E(U x ), E(U 2 ), V(U{), V(U 2 ) y CovlUj, U 2 ). 
c i 1 U l y U 2 son independientes? ^,Por que? 

d Consulte la Section 5.10. Demuestre que U l y U 2 tienen una distribucion normal bivariada. Identifique 
todos los parametros de la distribucion normal bivariada apropiada. 

*6.66 Sean (Fj, Y 2 ) que tienen funcion de densidad conjunta fy 1 ,Y 2 (yu y 2 ) y sean U l = Y { + Y 2 y U 2 = F 2 . 

a Demuestre que la densidad conjunta de (U l , U-,) es 

/t/i,t/ 2 (“i’ “ 2 ) = fyi,Y 2 ( u i —u 2 ,u 2 ). 
b Demuestre que la funcion de densidad marginal para U x es 

/ OO 

fyi,y 2 ( u i ~U2,u 2 )du2- 

•OO 

c Si Y { y Y 2 son independientes, demuestre que la funcion de densidad marginal para U 1 es 

/ OO 

fy 2 (u\ ~ u 2 ) fy 2 (U 2 ) dli 2 - 

•OO 

Esto es, que la densidad de Fj + Y, es la convolution de las densidades /y,(-) y /y 2 ('). 

*6.67 Sean (Y t , F 2 ) que tienen funcion de densidad conjunta fY l ,Y 1 ()’i, y 2 ) y sean U 1 = Y l /Y 1 y U 2 = Y 2 . 
a Demuestre que la densidad conjunta de (U 1 , U 2 ) es 

fu\,U 2 ( u l' u l) ~ fYi,Y 2 ( u l u 2, u 2.)\ u 2 \- 


b Demuestre que la funcion de densidad marginal para l/j es 

/ OO 

fy l ,y 2 l u i u i, u 2 )\u 2 \ du 2 . 

•OO 

c Si y Y 2 son independientes, demuestre que la funcion de densidad marginal para U 1 es 

/ OO 

fy l {uiU2)fY 2 {u 2 )\u 2 \ du 2 . 

-OO 


*6.68 Sean Y l y Y 2 que tienen la funcion de densidad conjunta 

fYi,y 2 (yu y 2 ) — 


8yiy 2 , 0 £ yi < y 2 £ 1, 

0, en cualquier otro punto, 


y U 1 = Y l /Y 2 y u 2 — y 2 . 
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a Deduzca la funcion de densidad conjunta para ((/j, U 2 ). 
b Demuestre que U l y U 2 son independientes. 

*6.69 Las variables aleatorias Y x y Y-, son independientes, ambas con densidad 


f(y ) = 


l 

0, 


i <y, 

en cualquier otro punto. 


Sean U\ 


Yi 

Yi+Y 2 


y U, = Kj + y 2 . 


a ^Cual es la densidad conjunta de Y l y Y 2 7 
b Demuestre que la densidad conjunta de U l y U 2 esta dada por 


/t/i,t/ 2 ( M i> “ 2 ) 


1 

M 2 (l — «i) 2 !<2 ' 

0, 


1/m x < u 2 , 0< < 1/2 y 

l/( 1 — Ml) < M2, 1/2 £ Ml £ 1, 
en cualquier otro punto. 


c Dibuje la region donde/j^, v (u u u 2 ) > 0. 
d Demuestre que la densidad marginal de U 1 es 


*6.70 


1 

2(1 -Mi) 2 ’ 


0 < Mi < 1/2, 


1/2 < Mi < 1, 

en cualquier otro punto. 
e £t/i y U 2 son independientes? i,Por que sf o por que no? 

Suponga que Y\ y Y 2 son independientes y que ambas estan uniformemente distribuidas en el intervalo 
(0, 1), y sean U i = Y l + Y 2 y U 2 = Y l — Y 2 . 

a Demuestre que la densidad conjunta de U l y U 2 esta dada por 




io 2 " r 


Jlh.Ui(UU u l) 


1/2, — mi < u 2 < mi, 0 < mi < 1 y 

Ml — 2 < M 2 < 2 — Ml, 1 < Ml < 2, 
0, en cualquier otro punto. 


b Dibuje la region donde/^, u (u v u 2 ) > 0. 
c Demuestre que la densidad marginal de U 1 es 


/c/i(mi) 


Mi, 

2 — Ml, 

0, 


0 < ui < 1, 

1 < Ml < 2, 

en cualquier otro punto. 


d Demuestre que la densidad marginal de (/, es 


fu 2 ( u 2 ) 


1 + M 2 , —1 < m 2 < 0, 

1 — M 2 , 0 £ Ml < 1, 

0, en cualquier otro punto. 


e iU l y U 2 son independientes? ^Por que sf o por que no? 

*6.71 Suponga que Y j y Y 2 son variables aleatorias e independientes distribuidas exponencialmente, ambas 
con media /3 y defina U l = Y r + Y 2 y U 2 = Y x jY 2 . 
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a Demuestre que la densidad conjunta de (U lt U 2 ) es 


fui,u 2 ( u u ui) 


1 

J 2 


u\e 


-ui/P 


1 

(1 + u 2 ) 2 


0 , 


0 < ui, 0 < u 2 . 


en cualquier otro punto. 


b iU l y U 2 son independientes? ^,Por que? 


6.7 Estadfsticos de orden 

Numerosas funciones de variables aleatorias de interes en la practica dependen de las mag¬ 
nitudes relativas de las variables observadas. Por ejemplo, podemos estar interesados en la 
maxima velocidad que se alcanza en una carrera de automoviles o en el raton mas pesado de 
entre los alimentados con cierta dieta. Esto quiere decir que con frecuencia ordenamos varia¬ 
bles aleatorias observadas de acuerdo con sus magnitudes. Las variables ordenadas resultantes 
se denominan estadisticos de orden. 

Formalmente, denotemos con Fj, Y 2 , , Y n a variables aleatorias continuas e indepen¬ 

dientes, con funcion de distribucion F(y) y funcion de densidad fly). Denotamos las variables 
aleatorias ordenadas Y i por F (1) y K (2) , . . . , Y (n) , donde F (1) < Y {1) < • • • < Y (n) . (Debido a que 
las variables aleatorias son continuas, los signos de igualdad pueden ignorarse.) Usando esta 
notacion, 

Y(\) =mm(Fi,F 2 ,..., F„) 


es la minima de las variables aleatorias Y t , y 

Y(n) =ma x(F 1 ,F 2 ,..., Y n ) 
es la maxima de las variables aleatorias Y t . 

Las funciones de densidad de probabilidad para F (1) y Y (nj se pueden determinar usando 
el metodo de las funciones de distribucion. Primero vamos a deducir la funcion de densidad 
de Y (n) . Como Y (n) es la maxima de Fj, F 2 ,. .. , Y n , el evento ( Y (n) < y) ocurrira si y solo si los 
eventos (Y l < y) ocurren para toda i = 1,2 ,... ,n. Esto es, 

P(Y (n) < y) = P{Y X < y, F 2 < y,..., F„ < y). 

Debido a que las Y t son independientes y P( Y l < y) = F(y) para i = 1, 2,. .., n, se deduce 
que la funcion de distribucion de Y (n) esta dada por 

F Yf Jy) = P(Y( n) < y) = P(Y { < y)P(F 2 < y) ■ ■ ■ P(F„ < y) = [F(y)f. 

Si con g (n) (y) denotamos la funcion de densidad de Y (n) , vemos que, al evaluar las derivadas 
de ambos lados, 

g in )(y) = n[F(y)]"- 1 f(y). 

La funcion de densidad para F ( t , se puede hallar de un modo similar. La funcion de distri¬ 
bucion de F (1) es 

Fv m (y) = ^(^( 1 ) — F) - 1 _ P(Y ( i) > y). 

Como F (1) es la minima de Y v Y 2 , . . . , Y n , se deduce que el evento (F (1) > y) ocurre si y solo 
si los eventos ( Y i > y) ocurren para i = 1,2,...,«. Debido a que las Y t son independientes y 
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P{Yj > y = 1 — F(y) para i= 1,2,, n, vemos que 

Fyjy) = P(Y ( i) < y) = 1 - P(Y a) > y) 

= 1 - P(Y\ >y,Y 2 >y,..., Y n > y) 

= 1 - [P(Y, > y)P(Y 2 > y) ••• P(Y„ > y)] 

= 1 -[1 -F(y)] n . 

Por consiguiente, si g ( , ,(y) denota la funcion de densidad de r<i>- al derivar en ambos lados de 
la ultima expresion obtenemos 


gm(y)=n[l-F(y)] n - l f(y). 

Consideremos ahora el caso n = 2 y determinemos la funcion de densidad conjunta para 
I'd) y Y( 2 ). El evento (7 (l) < y l5 Y (1] < y 2 ) significa que (7, < y 1; Y 2 < y 2 ) o (Y 2 < y lt Y l < y 2 ). 
[Observe que y (D podria ser Y { o Y 2 , cualquiera que sea mas pequena.] Por tanto, para iq ^ y 2 , 
P(Y m ^ 7i, Y m < y 2 ) es igual a la probabilidad de la union de los dos eventos (7, < y,, V 2 < 
y 2 ) y (Y 2 < y l5 Y ] < y 2 ). Esto es. 


F(7 ( p =£ Vi, Y ( 2) < y 2 ) = P[(Y X < y u Y 2 < y 2 ) U (7 2 < y u Y x < y 2 )]. 

Usando la ley aditiva de la probabilidad y tomando en cuenta que yq < y 2 , vemos que 
P(Y ( i) < yi, 7(2) yi) = P(Y\ < yi, 7 2 ^ yi) + P(Y 2 < vi, 7 X < v 2 ) 

— P{Y\ ^yi,Y 2 <yi). 

Como 7, y Y 2 son independientes y P(Y- < w) = F( w), para i = 1, 2, se deduce que, para 

yi - y 2 , 

P(Y ( i) < yi, 7(2) < y 2 ) = P’(y 1 )F(y 2 ) + / r (y 2 )/ r (yi) - F(yi)F(yi) 

= 2F(yj)F(y 2 ) - [F( yi )] 2 . 

Si y, > y 2 (recuerde que 7 (1) < 7 (2) ), 

F(7 ( i) < yi, 7( 2 ) < y 2 ) = P(7 ( d < y 2 , 7 (2 ) s y 2 ) 

= P{Y\ < y 2 , 7 2 < y 2 ) = [F(y 2 )] 2 . 

Resumiendo, la funcion de distribution conjunta de Y m y y (2) es 

2F(y!)F(y 2 ) - [F(yj)] 2 , y { < y 2 , 


72) - 


[F(y 2 )]", 


yi > y 2 - 


Si denotamos con gn^Oq, y 2 ) la densidad conjunta de 7 (1) y 7 (2) , vemos que, al derivar 
primero con respecto a y 2 y luego con respecto a y 1; 

, , \ 2/(yi)/(y2), 7i ^ 72 , 

ftl)(2)(7l> 72) - | . 

( 0, en cualquier otro punto. 

Se puede aplicar el mismo metodo para determinar la densidad conjunta de *U)’ Y (2)’ • • ■ > 


que resulta ser 

g(l)(2)---(n)(7l> 72, • • ■ , 7n) = 


( 1 )> ■‘( 2 )’ 

»!/(7l)/(72), • • • , /(7n), 7i — 72 — ■ ■ ' — 7n, 

0, en cualquier otro punto. 
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La funcion de densidad marginal para cualquiera de los estadfsticos de orden se puede hallar 
a partir de esta funcion de densidad conjunta, de lo cual no nos ocuparemos formalmente en 
este texto. 


EJEMPLO 6.16 Componentes electronicos de cierto tipo tienen una vida util Y, con densidad de probabilidad 
dada por 

/( ) = j ( 1 / 10O )e -,/100 . y >0, 

l 0, en cualquier otro punto. 

(La duracion de la vida util se expresa en horas.) Suponga que dos de estos componentes 
operan de manera independiente y en serie en cierto sistema (en consecuencia, el sistema 
falla cuando cualquiera de los dos componentes deja de funcionar). Encuentre la funcion de 
densidad para X, la duracion de la vida litil del sistema. 


Solucion Como el sistema deja de funcionar cuando falla el primer componente, X = rmnO'j, Y 2 ), don- 
de fj y Y 2 son variables aleatorias independientes con la densidad dada. Entonces, como F(y) 
= 1 — e“ v / 100 , para y > 0, 


fx(y) = gd)(y) 


y se deduce que 


fx(y) = 


= n[i - EoorVoo 

_ | 2e~>/ 100 (l/100)e^ 10 °, y > 0, 

l 0, en cualquier otro punto, 

j(l/50) e -?/ 50 , y > 0, 
l 0, en cualquier otro punto. 


Por tanto, el mfnimo de las dos variables aleatorias exponencialmente distribuidas tiene una 
distribucion exponencial. Observe que la duracion media de cada uno de los componentes es 
100 horas, mientras que la duracion media del sistema es E(X) = E( Y ,,. = 50 = 100/2. ■ 


EJEMPLO 6.17 Suponga que los componentes del Ejemplo 6.16 operan en paralelo (por tanto, el sistema no 
falla sino hasta que fallen los dos componentes). Encuentre la funcion de densidad de X, la 
duracion del sistema. 


Solucion 


Ahora X = maxO/, Y 2 ), y 


fx(y) = g(2)(y) 


y, por tanto, 


fx(y) = 


= n[E(y)f-‘/(y) 

_ | 2(1 -e' ;y / 100 )(l/100)e' y / 100 , 

~ lo, 


y > 0, 

en cualquier otro punto, 


(1/50)(e —y / 100 — e~ y / 50 ), 

0 , 


y > 0, 

en cualquier otro punto. 


Vemos aquf que el valor maximo de las dos variables aleatorias exponenciales no es una va¬ 
riable aleatoria exponencial. ■ 
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TEOREMA 6.5 


Aun cuando una deduction rigurosa de la funcion de densidad del estadfstico de &-esimo 
orden (k es un entero, 1 < k < n) es un poco complicada, la funcion de densidad resultante 
tiene una estructura intuitivamente sensible. Una vez que se comprende dicha estructura, la 
densidad se puede escribir con facilidad. Suponga que la funcion de densidad de una variable 
aleatoria continua en un punto particular es proporcional a la probabilidad de que la varia¬ 
ble sea “cercana” a ese punto. Esto es, si Y es una variable aleatoria continua con funcion de 
densidad/(v), entonces 


P(y<Y <y+dy)~ f(y)dy. 


Ahora considere el estadfstico de A-esimo orden, Y(k). Si el A-esimo valor mas grande es 
cercano a y k , entonces k — 1 de los valores de Y debe ser menor que y k , una de las Y debe 
ser cercana a y k , y los restantes n — k valores de las Y deben ser mayores que y k . Recuerde la 
distribution multinomial de la Section 5.9. En este caso, tenemos tres clases de valores de Y: 

Clase 1: las Y que tienen valores menores que y k necesitan k — 1. 

Clase 2: las Y que tienen valores cercanos que y k necesitan 1. 

Clase 3: las Y que tienen valores mayores que y k necesitan n — k. 

Las probabilidades de cada una de estas clases son, respectivamente, p x = P(Y < y k ) = 
Fi. v t ), P 2 = p (y k - Y - Yk + dy k ) ^f(y k )dy k , y p 3 = P(y > y k ) = 1 - F(y k ). Usando las proba¬ 
bilidades multinomiales estudiadas antes, vemos que 


P(yk =£ Y(k) =£ yk+ dyk) 

~ P[(A — 1) de la clase 1, 1 de la clase 2, ( n — k) de la clase 3] 


n 

1 1 n — k 

n ! 


Pi 1 Pi P" k 


(k - 1)! 1! (n — k)\ 


f{y k )dy k [l - F{y k )T~ k \ 


y 


g(k)(y k ) dy k - (A , _ 1) ,”, ! (n _ fc) , ^- 1 (.VA-) f{y k ) [1 - F(y k )r~ k dy k . 


La densidad del estadfstico de fe-esimo orden y la densidad conjunta de estadfsticos de orden 
dos se dan en el teorema siguiente. 


Sean Y v ..., Y n variables aleatorias continuas distribuidas identicamente e independientes, 
con funcion de distribution comun F(y) y funcion de densidad comun f(y). Si denota el 
estadfstico de orden A'-esimo, entonces la funcion de densidad de esta dada por 

g<k,(y k ) = - --— [Fiyk)?- 1 [1 - F(y k )] n - k f{y k ), 

{k — 1)! (n — k)\ 

—oo < yk < oo. 
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Si j y k son dos enteros tales que 1 < j < k < n, la densidad conjunta de Y (r> y Y (k ) esta 
dada por 

») - 0 - _ (f: _ J), _ i:)! 

x [F(yt) - F(yj)] k ~ 1 ~j X [1 - F(y t )] fl “* f(yj) f(y k ), 

—oo < yj < y k < oo. 


La derivacion intuitiva, heuristica, de la densidad conjunta dada en el Teorema 6.5 es si¬ 
milar a la establecida antes para la densidad de un estadfstico de un solo orden. Para y ; <%. 
la densidad conjunta se puede interpretar como la probabilidad de que lay-esima observation 
mas grande sea cercana a y- y la A-esima mas grande sea cercana a y k . Defina las cinco clases 
de valores de Y: 

Clase 1: las Y que tengan valores menores que y- necesitan j — 1. 

Clase 2: las Y que tengan valores cercanos a y- necesitan 1. 

Clase 3: las Y que tengan valores entre v y y k necesitan k — 1 — j. 

Clase 4: las Y que tengan valores cercanos a y k necesitan 1. 

Clase 5: las Y que tengan valores mayores que y k necesitan n — k. 

De nuevo, use la distribucion multinomial para completar el argumento heurfstico. 


EJ EM P LO 6 . 18 Suponga que Y x , Y 2 ,... ,Y S denota una muestra aleatoria de una distribucion uniforme defini- 
da en el intervalo (0, 1). Esto es, 

0 < y < 1, 

en cualquier otro punto. 


f(y) = 


Encuentre la funcion de densidad para el estadfstico de segundo orden. Tambien, proporcione 
la funcion de densidad conjunta para los estadfsticos de segundo y cuarto ordenes. 


Solucion La funcion de distribucion asociada con cada una de las Y es 


F(y) 


0, y < 0, 

y, 0 <y<l, 

1, y>l. 


La funcion de densidad del estadfstico de segundo orden, Y (2) , se puede obtener directamente 
del Teorema 6.5 con n = 5, k = 2. Asf, con fly) y F(y) como se vio, 

g(2){yi) = _ :) f (5 _ 2) , [F(.V 2 )] 2 ~ 1 [l - F(y 2 )] 5 ^ 2 -oo <y 2 <oo, 

20y 2 (l - J2) 3 , 0<)>2<l, 

0, en cualquier otro punto. 

La anterior es una densidad beta con a = 2 y /3 = 4. En general, el estadfstico de A'-esimo 
orden basado en una muestra de tamano n desde una distribucion uniforme (0, 1) tiene una 
densidad beta con a = ky [5 = n — k + 1. 
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La densidad conjunta para los estadfsticos de segundo y cuarto ordenes se obtiene facil- 
mente del segundo resultado del Teorema 6.5. Con f(y) y F(y) como antes, j= 2, k = 4 y 
n= 5, 

g(.2)(A)(yi, y 4 ) = (2 _ 1} , (4 _ i 2) , (5 _ 4) , [F(y 2 )f- 1 [F(y 4 ) - F(y 2 )] 4 ~‘~ 2 

X [1 - f (y 4 )] 5 ~ 4 /(y 2 ) f(y 4 ), -00 < y 2 < J4 < 00 

= ( 5! y 2 (y 4 ~ F 2 X 1 - >’ 4 ), 0 < y 2 < y 4 =£ 1 

| 0, en cualquier otro punto. 

Desde luego, esta densidad conjunta se puede usar para evaluar probabilidades conjuntas acer- 
ca de F (2) y Y W o para evaluar el valor esperado de funciones de estas dos variables. ■ 


Ejercicios 

6.72 Sean Fj y Y 2 independientes y distribuidas uniformemente en el intervalo (0, 1). Encuentre 
a la funcion de densidad de probabilidad de U 1 = minfFj, Y 2 ). 

b E(U,)yV{U,). 

6.73 A1 igual que en el Ejercicio 6.72, sean Fj y Y n independientes y distribuidas uniformemente en el inter¬ 
valo (0, 1). Encuentre 

a la funcion de densidad de probabilidad de U 2 = maxlF^, F,), 
b E(U 2 )yV(U 2 ), 

6.74 Sean Y lt Y 2 , , Y n variables aleatorias independientes distribuidas uniformemente en el intervalo 

[0, 6]. Encuentre la 

a funcion de distribution de probabilidad de F (n) = max(F 15 Y 2 ,... , Y n ), 
b funcion de densidad de V 
c media y varianza de y (»)- 

6.75 Consulte el Ejercicio 6.74. Suponga que el numero de minutos que espera para abordar un autobus esta 
distribuido uniformemente en el intervalo [0, 15]. Si una persona toma el autobus cinco veces, ^,cual es 
la probabilidad de que su espera mas larga sea menor que 10 minutos? 

*6.76 Sean Fj, F 2 , . . . , F„ variables aleatorias distribuidas uniformemente e independientes en el intervalo 

[o, ei 

a Encuentre la funcion de densidad de Y (ty el estadfstico de fc-esimo orden, donde k es un entero entre 
1 y n. 

b Use el resultado del inciso a para determinar E(Y^). 
c Encuentre V(Y (k) ). 

d Utilice el resultado del inciso c para hallar E(Y (k) — Y (k _ V] ), la diferencia media entre dos estadfsticos 
de orden sucesivo. Interprete este resultado. 

*6.77 Sean Fj, F 2 , . . . , F„ variables aleatorias distribuidas uniformemente e independientes en el intervalo 

[ 0 , d]. 

a Encuentre la funcion de densidad conjunta de Y d) y y ® donde j y k son enteros 1 < j < k ^ n. 
b Utilice el resultado del inciso a para hallar Cov(y^, Y^) cuando j y k son enteros 1 <j<k^n. 
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c Utilice el resultado del inciso b y el Ejercicio 6.76 para hallar V(Y (k) - la varianza de la diferencia 
entre estadisticos de orden dos. 

6.78 Consulte el Ejercicio 6.76. Si Ej, Y 2 ,. .., F„ son variables aleatorias uniformemente distribuidas e inde- 
pendientes en el intervalo [0, 1], demuestre que la estadfstica de i-esimo orden, tiene una funcion 
de densidad beta con a— ky /3 = n- k + 1. 

6.79 Consulte el Ejercicio 6.77. Si Fj, Y 2 , . . . , Y n son variables aleatorias independientes uniformemente 

distribuidas en el intervalo [0, 6 ], demuestre que U = son independientes. 

6.80 Sean Ej, Y 2 , . . . , Y n variables aleatorias independientes, cada una con una distribution beta, con a = /3 
= 2. Encuentre 

a la funcion de distribution de probabilidad de y «= max(Fj, F 2 , . . ., Fj, 
b la funcion de densidad de 
c E(Y W ) cuando n = 2. 

6.81 Sean Y v F 2 , . . ., Y n variables aleatorias exponencialmente distribuidas e independientes con media /3. 

a Demuestre que y <U = mm(Fj, F 2 , . . ., Fj tiene una distribucion exponencial, con media f3/n. 
b Si n = 5 y p = 2, encuentre /"(F^ ^ 3.6). 

6.82 Si F es una variable aleatoria continua y m es la mediana de la distribucion, entonces m es tal que 
P(Y < m) = P(Y > m) = 1/2. Si F 1; F 2 ,..., F„ son variables aleatorias exponencialmente dis¬ 
tribuidas e independientes con media /3 y mediana m, el Ejemplo 6.17 implica que 4) = max(F!, 
F 2 , . . . , Y n ) no tiene una distribucion exponencial. Use la forma general de p Y (y) para demostrar que 
P(Y (n) > m) = 1 -(.5)". 

6.83 Consulte el Ejercicio 6.82. Si Fj, F 2 , . . . , F„ es una muestra aleatoria de cualquier distribucion continua 
con media m, ^,cual es P( F (n) > m)l 

6.84 Consulte el Ejercicio 6.26. La funcion de densidad Weibull esta dada por 

y > 0, 

7(F) = j a 

l 0, en cualquier otro punto, 

donde a y m son constantes positivas. Si una muestra aleatoria de tamano n se toma de una poblacion 
con distribucion Weibull, encuentre la funcion de distribucion y la funcion de densidad para y U) = 
mfn(Fj, F 2 , . . . , Fj. ( ',F (I) tiene una distribucion Weibull? 

6.85 Sean Y l y F 2 independientes y uniformemente distribuidas en el intervalo (0, 1). Encuentre P(2F (1) < 

>e,>- 

*6.86 Sean Y l , Y 2 , . . . , Y n variables aleatorias independientes exponencialmente distribuidas con media /). 
Obtenga la 

a funcion de densidad para Y (k» el estadfstico de fc-esimo orden, donde k es un entero entre 1 y n. 
b funcion de densidad conjunta para Y w y donde j y k son enteros 1 < j < f < n. 

6.87 Los precios de apertura por action Fj y F 2 de dos acciones similares son variables aleatorias indepen¬ 
dientes, cada una con una funcion de densidad dada por 

(l/2)f? _a/2Xy_4) , y>4, 

f(y) = , 

0, en cualquier otro punto. 

En una manana determinada, un inversionista va a comprar acciones de la emision menos costosa. 
Encuentre 
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a la funcion de densidad de probabilidad para el precio por action que el inversionista pagara. 
b el costo esperado por action que el inversionista pagara. 

6.88 Suponga que el tiempo Y que un trabajador tarda en completar cierta tarea tiene la funcion de densidad 
de probabilidad dada por 


f(y) 


e-b'-'b, y>Q, 

0, en cualquier otro punto. 


donde 6 es una constante positiva que representa el tiempo minimo hasta la termination del trabajo. Sea 
Y v Y 2 , ... , F„ una muestra aleatoria de tiempos de termination de esta distribution. Encuentre 

a la funcion de densidad para y (D = imnffj, Y 2 ,... , Y n ). 
b E(Y m ). 

*6.89 Si Fj, Y 2 , ... , Y n representan una muestra aleatoria de la distribution uniforme /(y) = 1, 0Sj< 1 
encuentre la funcion de densidad de probabilidad de la amplitud R = - V 

*6.90 Suponga que el numero de veces que ocurre cierto evento en el intervalo (0, t) tiene una distribution de 
Poisson. Si sabemos que n de tales eventos han ocurrido en (0, t ), entonces los tiempos reales, medidos 
desde 0, para los sucesos del evento en cuestion forman un conjunto ordenado de variables aleatorias, 
que denotamos con W m £ < • ■ ■ < VF (n) . [W w en realidad es el tiempo de espera de 0 hasta que 

ocurre el i-esimo evento.] Se puede demostrar que la funcion de densidad conjunta para VF (1) , IV (2) , . . ., 
W fn) esta dada por 


w„) = 


n ! 
t" ’ 
0 , 


Wl ^ W 2 — ' ' ' — W„, 

en cualquier otro punto. 


[Esta es la funcion de densidad para la muestra ordenada de tamano n desde una distribucion uniforme 
en el intervalo (0, t).\ Suponga que las llamadas telefonicas que entran en un conmutador siguen una 
distribucion de Poisson con una media de diez llamadas por minuto. En un periodo lento de dos minutos 
de duration solo entraron cuatro llamadas. Encuentre 

a la probabilidad de que las cuatro llamadas entren durante el primer minuto; es decir, encuentre P( W (4) 
£1), 

b el tiempo de espera desde el principio de los dos minutos hasta la cuarta llamada. 

* 6.91 Suponga que n componentes electronicos, cada uno con una vida util distribuida exponencialmente con 
media 9, se ponen en operation al mismo tiempo. Los componentes operan en forma independiente y 
se observan hasta que de ellos fallan (r £ n). Sea W- el tiempo que transcurre hasta que el componente 
j-6 simo falla, con W 1 £ W 2 S ■ • • £ W r . Sea Tj= Wj — Wj _j para j S: 2 y T l = VFj. Observe que T- mide 
el tiempo transcurrido entre fallas sucesivas. 

a Demuestre que T-, para j — 1, 2, . . ., r, tiene una distribucion exponential con media 0/(n — j + 1). 
b Demuestre que 


r r 

U r =J2 Wj + (.n - r)W r = - j + \)T ] 

i =i j =i 


y, en consecuencia, que E(U r )= rd. [U r se denomina vida util total obsen’ada y podemos usar U r /r 
como una aproximacion (o “estimador”) de 0.] 
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6.8 Resumen 

En este capftulo abordamos las distribuciones de probabilidad para funciones de variables 
aleatorias. Este es un problema importante en estadfstica porque los estimadores de parame- 
tros poblacionales son funciones de variables aleatorias. Por consiguiente, es necesario cono- 
cer un poco acerca de las distribuciones de probabilidad de estas funciones, o estimadores, 
para evaluar la bondad de nuestros procedimientos estadisticos. Un analisis de la estimacion 
se presenta en los Capftulos 8 y 9. 

Los metodos para determinar las distribuciones de probabilidad para funciones de varia¬ 
bles aleatorias son el de las funciones de distribucion (Seccion 6.3), el de las transformaciones 
(Seccion 6.4) y el de las funciones generadoras de momentos (Seccion 6.5). Debe observarse 
que no hay un particular mejor para todas las situaciones, ya que la solucion depende en gran 
medida de la naturaleza de la funcion de que se trate. Si U l y U 2 son dos funciones de las 
variables aleatorias continuas Y, y Y 2 , la funcion de densidad conjunta para U l y U 2 se puede 
determinar usando la tecnica del jacobiano de la Seccion 6.6. La facilidad para manejar estos 
metodos se puede obtener solo por medio de la practica. Los ejercicios al final de cada seccion 
y de cada capftulo son un buen punto de partida. 

Las funciones de densidad de estadisticos de orden se presentaron en la Seccion 6.7. 

En el capftulo 7 se consideraran algunas funciones especiales de variables aleatorias que 
son particularmente utiles en la inferencia estadfstica. 
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Ejercicios complementarios 

6.92 Si Yj y Y 2 son variables aleatorias normales independientes y distribuidas identicamente con media p y 
varianza cr 2 , encuentre la funcion de densidad de probabilidad para U = (l/2)(Yj — 3Y 2 ). 

6.93 Cuando la corriente I pasa por la resistencia R , la potencia generada esta dada por W = I 2 R. Suponga 
que I dene una distribucion uniforme en el intervalo (0, 1) y R tiene una funcion de densidad dada por 


2 r, 0<r<l, 

0, en cualquier otro punto. 


Encuentre la funcion de densidad de probabilidad para W. (Suponga que I es independiente de R .) 



342 


Capftulo 6 Funciones de variables aleatorias 


6.94 


6.95 


6.96 

*6.97 


6.98 


*6.99 

6.100 


* 6.101 


6.102 


*6.103 


Dos expertos en eficiencia toman medidas independientes Fj y Y 2 acerca del tiempo que tardan unos 
trabajadores para completar cierta tarea. Se supone que cada una de las medidas tiene una funcion de 
densidad dada por 


f (1 14)ye~ y l 2 , y > 0, 

fiy) = ■ 

0, en cualquier otro punto. 

Encuentre la funcion de densidad para el promedio U = (1 /2)(Y l + F 2 ). [Sugerencia: use el metodo de 
funciones generadoras de momenta.] 

Sean Y l y F 2 independientes y uniformemente distribuidas en el intervalo (0, 1). Encuentre la funcion de 
densidad de probabilidad de cada uno de los siguientes: 

a lh = Y l /Y 2 . 
b U 2 = -In (F,F 2 ). 

C U 3 = Y,Y 2 . 

Suponga que Fj esta normalmente distribuida con media 5 y varianza 1 y Y 2 esta normalmente distribui- 
da con media 4 y varianza 3. Si Fj y F 2 son independientes, ),cual es 1°(F 1 >F 2 )? 

Suponga que F, es una variable aleatoria binomial con cuatro intentos y probabilidad de exito .2 y que 
F 2 es una variable aleatoria binomial independiente con tres intentos y probabilidad de exito .5. Sea 
W = Fj+ F 2 . De acuerdo con el Ejercicio 6.53(e), W no tiene distribution binomial. Encuentre la fun¬ 
cion de masa de probabilidad para W. [Sugerencia: P(W — 0) = P(Y x = 0, F 2 = 0); P(W — 1) = 
P(Y l = 1, Y 2 = 0) + P(Y X = 0 ,Y 2 = 1); etc.] 

El tiempo que una maquina opera sin falla esta denotado por Fj y el tiempo para reparar una falla, por 
F 2 . Despues de hacer una reparation, se supone que la maquina opera como nueva. Y x y F 2 son indepen¬ 
dientes y cada uno tiene la funcion de densidad 

e~ y , y > 0, 

/(?) 

0, en cualquier otro punto. 

Encuentre la funcion de densidad de probabilidad para U = Fj /(Fj + F 2 ), la proportion de tiempo en 
que la maquina esta en operation durante cualquier ciclo de operation-reparation. 

Consulte el Ejercicio 6.98. Demuestre que U, la proportion del tiempo que la maquina esta operando 
durante cualquier ciclo de operation-reparation, es independiente de Y x + F„ la duration del ciclo. 

El tiempo hasta que se presenta una falla en un aparato electronico tiene una distribution exponential 
con media de 15 meses. Si se prueba una muestra aleatoria de cinco de esos aparatos, £cual es la proba¬ 
bilidad de que la primera falla entre los cinco aparatos ocurra 

a despues de 9 meses?, 
b antes de 12 meses? 

Una paracaidista desea caer en un bianco T, pero encuentra que es igualmente probable que caiga en 
cualquier punto sobre una recta (A, B), en la que T esta en el punto medio. Encuentre la funcion de den¬ 
sidad de probabilidad de la distancia entre el punto de cafda de la paracaidista y el bianco. [Sugerencia: 
denote -1 con A, +1 con By 0 con T. Entonces el punto de cafda de la paracaidista tiene una coordenada 
X, que esta distribuida uniformemente entre -1 y +1. La distancia entre X y Fes |X|.] 

Dos policfas son enviados a patrullar un camino de 1 milla de largo. Los policfas son asignados a puntos 
escogidos independientemente y al azar a lo largo del camino. Encuentre la probabilidad de que los 
policfas esten a menos de 1/2 milla entre sf cuando lleguen a sus puestos asignados. 

Sean Fj y F, variables aleatorias normales estandar e independientes. Encuentre la funcion de densidad 
de probabilidad de U — Y x /Y 2 . 
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6.104 Sean Y l y Y 2 variables aleatorias independientes, cada una con la misma distribucion geometrica. 

a Encuentre P(Y t = F 2 ) = P(Y 1 — Y 2 = 0). [Sugerencia: su respuesta debe incluir la evaluation de una 
serie geometrica infinita. Los resultados del Apendice A 1.11 le seran utiles.] 
b Encuentre P(Fj — Y 2 = 1). 

*c Si U = Fj — F 2 , encuentre la funcion de probabilidad (discreta) para U. [Sugerencia: el inciso a da 
P{U = 0) y el inciso b da P(U = 1). Considere por separado los valores enteros positivos y negativos 
para (/.] 

6.105 Una variable aleatoria F tiene una distribucion beta de segunda close, si, para a > 0 y /3 > 0, su densi- 
dad es 

f f "" 1 >q 

fy(y) = | B(ct,P)( l+yr+P’ y 

l 0, en cualquier otro punto. 

Deduzca la funcion de densidad de(/ = 1/(1 + F). 

6.106 Si F es una variable aleatoria continua con funcion de distribucion F(y), encuentre la funcion de densi¬ 
dad de probabilidad de U = F{Y). 

6.107 Sea F distribuida uniformemente en el intervalo (-1, 3). Encuentre la funcion de densidad de probabili¬ 
dad de U = F 2 . 

6.108 Si F denota la vida util de un componente y F(y) es la funcion de distribucion de F, entonces P(Y> y) = 
1 — F(y) se llama confiabilidad del componente. Suponga que un sistema formado por cuatro compo- 
nentes con funciones de confiabilidad identicas, 1 — F(y), opera como se indica en la Figura 6.10. El 
sistema opera correctamente si una cadena ininterrumpida de componentes esta en operacion entre A 
y B. Si los cuatro componentes operan independientemente, encuentre la confiabilidad del sistema en 
terminos de F(y). 


FIGURA 6.10 
Diagrama 
de circuito 



6.109 El porcentaje de alcohol en cierto compuesto es una variable aleatoria F, con la siguiente funcion de 
densidad: 

/(v) = ( 2 °F 3 ( 1 -F)’ 0<y<l 

I 0, en cualquier otro punto. 

Suponga que el precio de venta del compuesto depende de su contenido de alcohol. Especificamente, 
si 1/3 < y < 2/3, el compuesto se vende en C/ dolares por galon; en cualquier otro punto, se vende 
en C 2 dolares por galon. Si el costo de production es C 3 dolares por galon, encuentre la distribucion de 
probabilidad de la utilidad por galon. 
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6.110 


* 6.111 


* 6.112 


*6.113 


Un ingeniero ha observado que los tiempos de separacion entre vehlculos que pasan por cierto punto en 
una carretera, tienen una distribucion exponencial con media de 10 segundos. Encuentre la 

a probabilidad de que el siguiente tiempo de separacion observado no sea de mas de un minuto. 
b probabilidad de la funcion de densidad para la suma de los siguientes cuatro tiempos de separacion 
que van a ser observados. ^Que suposiciones son necesarias para que esta respuesta sea correcta? 

Si una variable aleatoria U esta distribuida normalmente con media /u, y varianza cr 2 y Y = e u [o bien, lo 
que es equivalente, U = ln(K)], entonces se dice que Y tiene una distribucion log-normal. La distribucion 
log-normal se usa con frecuencia en ciencias biologicas y flsicas para modelar magnitudes, ya sea de 
volumen o peso, de diversas cantidades, como pueden ser partlculas de carbon, colonias de bacterias y 
animales individuals. Sean U y Y las variables establecidas. Demuestre que 


a la funcion de densidad para Y es 


/(>0 


(- 1 — ) e “ (bl y > o, 

\ycrV2n J 

0, en cualquier otro punto. 


b E(Y) = g' i+(o ' 2 / 2 i y V{Y) = e 2 ,i+ " 2 (e a2 — 1). [Sugerencia: recuerde que E(Y) = E(e u )yE(Y 2 ) — 
E(e 2u ), donde U esta distribuida normalmente con media gt y varianza cr 2 . Recuerde que la funcion 
generadora de mementos de U es = e' u .] 


Si una variable aleatoria U tiene una distribucion gamma con parametros a > 0 y /3 > 0. entonces se 
dice que Y = e u [o bien, lo que es lo mismo, U = ln(F)] tiene una distribucion log-gamma. La distribu¬ 
cion log-gamma es utilizada por actuarios como parte de un importante modelo para la distribucion de 
reclamaciones de seguros. Sean U y Y las variables establecidas. 


a Demuestre que la funcion de densidad para Y es 


/O') = |_r(a)/J“_ 

l 0, 


„-(l+/3)//3 


(In y) a 


y>U 

en cualquier otro punto. 


b Si fi < 1, demuestre que E(Y) = (1 - j3) “. [Vea la sugerencia para el inciso c.] 
c Si /3 < .5, demuestre que V(Y) = (1 — 2/3)~ a — (1 — fi)~ 2a . [Sugerencia: recuerde que £(10 = E(e u ) 
y E{Y 2 ) = E(e 2u ), donde U tiene distribucion gamma con parametros a> 0 y fi > 0, y que la funcion 
generadora de momento de una variable aleatoria con distribucion gamma solo existe si t< /3 1 ; vea 
el Ejemplo 4.13.] 

Considere que (Fj, F 2 ) tiene funcion de densidad conjunta fri,r 2 (yu F 2 ) y sean U l = Y l Y 1 y U 2 = Y 2 . 
a Demuestre que la densidad conjunta de (U l ,U 2 ) es 


fui,u 2 ( u i’ u 2 ) — /zi,y 2 ( —> “2 ) t—7. 


u 1 


u 2 


1 


I “ 2 1 


b Demuestre que la funcion de densidad marginal para U l es 


fuM 1 ) = f” fy u y 2 

J-00 \ u 2 


—, U 2 


- du-t. 


I«2| 


c Si Y l y Y 2 son independientes, demuestre que la funcion de densidad marginal para U 1 es 


/t?i(«i) = 


rx^ 


fr 2 (. u 2)7—7 du 2 - 

I u 2\ 
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* 6.114 


* 6.115 


* 6.116 


Una maquina produce recipientes esfericos cuyos radios varfan de acuerdo con la funcion de densidad 
de probabilidad dada por 


fir) = 


2 r, 0<r<l, 

0, en cualquier otro punto. 


Encuentre la funcion de densidad de probabilidad para el volumen de los recipientes. 

Denote con v el volumen de una figura tridimensional. Sea Y el numero de particulas observadas en 
el volumen v y suponga que Y tiene una distribucion de Poisson con media An. Las particulas podrian 
representar contaminantes del aire, bacterias en agua o estrellas en el cielo. 

a Si un punto se escoge al azar dentro del volumen v, demuestre que la distancia R a la particula mas 
cercana tiene la funcion de densidad de probabilidad dada por 

{ 4AtT r 2 e -( 4 /3)Airr 3 , r > 0, 

fir ) = \ 

[ 0, en cualquier otro punto. 

b Si R es corno en el inciso a, demuestre que U = R 3 tiene una distribucion exponencial. 

Sea (Pj, Y 2 ) que tiene funcion de densidad conjunta fy li y 2 (y i, > 2 ) y sean = ~Y 2 y U 2 — Y 2 . 

a Demuestre que la densidad conjunta de (U { , U 2 ) es 


fu l ,u 2 i u i’ u 2> ~ fY 1 ,Y 2 i u l + uf). 
b Demuestre que la funcion de densidad marginal para U x es 

/ OO 

/ri,y 2 ( M i +u 2 ,u 2 )du2. 

•OO 

c Si Kj y Y 2 son independientes, demuestre que la funcion de densidad marginal para U l es 

/ OO 

fyfUl +U 2 )fy 2 iu 2 )du 2 . 

•00 
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Distribuciones muestrales y 
el teorema del Ifmite central 


7.1 Introduccion 

7.2 Distribuciones muestrales relacionadas con la distribucion normal 

7.3 Teorema del Ifmite central 

7.4 Una demostracion del teorema del Ifmite central (opcional) 

7.5 Aproximacion normal a la distribucion binomial 

7.6 Resumen 

Bibliograffa y lecturas adicionales 


7.1 Introduccion 


En el Capftulo 6 presentamos metodos para hallar las distribuciones de funciones de variables 
aleatorias. A lo largo de este capftulo trabajaremos con funciones de las variables Tj, Y 2 ,..., Y n 
observadas en una muestra aleatoria seleccionada de una poblacion de interes. Como se ex- 
plico en el Capftulo 6, las variables aleatorias Y v Y 2 , . . . , Y n son independientes y tienen la 
misma distribucion. Algunas funciones de las variables aleatorias observadas en una muestra 
se usan para calcular o tomar decisiones acerca de parametros desconocidos de la poblacion. 

Por ejemplo, suponga que deseamos estimar una media poblacional /j,. Si obtenemos una 
muestra aleatoria de n observaciones, y x , y 2 ,. .., y n , parece razonable estimar /jl con la media 
muestral 



La bondad de esta estimacion depende del comportamiento de las variables aleatorias Y t , 
Y 2 ,..., Y n y el efecto que este comportamiento tiene sobre Y = (1 /n) YH=i ^ - Observe que 
la variable aleatoria Y es una funcion de (solo) las variables aleatorias Y v Y 2 ,..., Y n y el tama- 
no muestral n (constante). La variable aleatoria Y es por tanto un ejemplo de un estadistico. 
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DEFINICION 7.1 Un estadistico es una funcion de las variables aleatorias observables en una muestra y 
de constantes conocidas. 


Usted ha encontrado numerosas estadfsticas, la media muestral Y. la varianza muestral 
S 2 , F(„) = max(Fi, Y 2 ,..., Y n ), Y m = min (Y u Y 2 ,..., Y „), la amplitud R = F (n) - Y (l) , 
la mediana muestral, etcetera. Se usan estadfsticos para hacer inferencias (estimaciones o 
decisiones) acerca de parametros de poblacion desconocidos. Como todos los estadfsticos 
son funciones de las variables aleatorias observadas en una muestra, tambien son variables 
aleatorias. En consecuencia, todos los estadfsticos tienen distribuciones de probabilidad, que 
llamaremos sus distribuciones muestrales. Desde un punto de vista practico, la distribucion 
muestral de un estadistico proporciona un modelo teorico para el histograma de frecuencia 
relativa de los posibles valores del estadistico que observarfamos por medio de muestreo re- 
petido. 

El siguiente ejemplo contiene una distribucion de muestreo de la media muestral cuando se 
obtienen muestras de una poblacion conocida asociada con lanzar al aire un dado sin cargar. 


EJEMPLO 7.1 Un dado sin cargar se lanza tres veces. Sean Fj, Y 2 y F 3 el numero de puntos vistos en la 
cara superior para los tiros 1, 2 y 3, respectivamente. Suponga que estamos interesados en 
Y = (Y\ + Y 2 + F 3 )/3, el numero promedio de puntos vistos en una muestra de tamano 3. 
('.Cuales son la media pty y la desviacion estandar cry, de F? ^Como podemos determinar la 
distribucion muestral de F? 


Solucion En el Ejercicio 3.22 se demostro que p = E(Yj) = 3.5 y a 2 = V(F,) = 2.9167, i = 1, 2, 3. 

Como F 1? F 2 y F 3 son variables aleatorias independientes, el resultado obtenido en el Ejemplo 
5.27 (usando el Teorema 5.12) implica que 

- -a 2 2.9167 ,- 

E(Y) = ii = 3.5, V{Y) = — = —— =.9722, oy =V.9722 = .9860. 

(■.Como podemos deducir la distribucion de la variable aleatoria F? Los posibles valores de 
la variable aleatoria W = F t + F 2 + F 3 son 3, 4, 5, . . . , 18 y F = W/ 3. Como el dado esta 
equilibrado, es decir, no cargado, cada uno de los 6 3 = 216 valores distintos de la variable 
aleatoria multivariante (Y t , F 2 , F 3 ) son igualmente probables y 

P(Y\ = y u Y 2 = >’ 2 , F 3 = y 3 ) = p(y u y 2 , y 3 ) = 1/216, 
y,- = 1,2,..., 6, i = 1,2,3. 

Por tanto, 

P(Y = 1) = P(W =3) = p(l, 1, 1) = 1/216 

P(Y = 4/3) = P(W =4) = p( 1, 1, 2) + p( 1, 2, 1) + p( 2, 1, 1) = 3/216 

P(Y =5/3) = P(W =5) = p( 1, 1, 3) + p( 1, 3, 1) + p(3, 1, 1) 

+ p( 1,2, 2) + p(2, 1,2) + p(2,2, 1) = 6/216. 

Las probabilidades P(Y = i/3), i = 7, 8,..., 18 se obtienen de manera analoga. ■ 
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FIGU RA 7.1 

(a) Distribucion de 
muestreo simulado 

para Y, Ejemplo 7.1; 

(b) media y desvia- 
cion estandar de 
los 4000 valores 
simulados de Y 


Frecuencia 


Numero de tiros = 4000 



(a) 


Prob. de pobl. (1) 0.167 (2) 0.167 (3) 0.167 (4) 0.167 (5) 0.167 (6) 0.167 

Poblacion: Media = 3.500 Desv.Est. = 1.708 

Muestras = 4000 de tamafio 3 

Media = 3.495 

Desv. Est. = 0.981 

+/- 1 Desv. Est.: 0.683 

+/- 2 Desv. Est.: 0.962 

+/- 3 Desv. Est.: 1.000 

(b) 


La deduction de la distribucion de muestreo de la variable aleatoria Y trazada en el Ejemplo 
7.1 utiliza el metodo de punto de muestra que se introdujo en el Capftulo 2. Aun cuando no 
es diffcil completar los calculos del Ejemplo 7.1 y dar la distribucion de muestreo exacta para 
Y, el proceso es tedioso. ( : ,C6mo podemos tener una idea de la forma de esta distribucion de 
muestro sin molestarnos en completar estos calculos? Una forma es simular la distribucion 
de muestreo al tomar muestras independientes repetidas, cada una de tamano 3, calculando 
el valor observado y para cada muestra y construyendo un histograma de estos valores ob- 
servados. El resultado de una de estas simulaciones se ilustra en la Figura 7.1(a), que es una 
grafica obtenida usando la aplicacion breve DiceSample (disponible en www.thomsonedu. 
com/statistics / wackerly). 

(j Que puede observar en la Figura 7.1(a)? Como ya dijimos, el maximo valor observado de 

Y es 6 y el valor mi'nimo es 1. Tambien, los valores obtenidos en la simulation se acumulan 
en forma de montfculo aproximadamente centrado en 3.5, que es la media teorica de Y. En la 
Figura 7.1(b) vemos que el promedio y desviacion estandar de los 4000 valores simulados de 

Y son muy cercanos a los valores teoricos obtenidos en el Ejemplo 7.1. 
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Algunos de los ejercicios del final de esta seccion utilizan la aplicacion breve DiceSample 
para explorar la distribucion muestral simulada de Y para diferentes tamanos muestrales y 
para tiros de dados en los que se usan dados “cargados”. Otras aplicaciones se usan para si- 
mular las distribuciones muestrales para la media y la varianza de muestras tomadas de una 
distribucion en forma de campana. 

A1 igual que las distribuciones muestrales simuladas que usted observara en los ejercicios, 
la forma de la distribucion muestral teorica de cualquier estadfstico dependent de la distribu¬ 
cion de las variables aleatorias observables de la muestra. En la siguiente seccion usaremos los 
metodos del Capftulo 6 para deducir las distribuciones muestrales para algunos estadfsticos 
empleados para hacer inferencias acerca de los parametros de una distribucion normal. 


Ejercicios 

Ejercicio Applet En el Ejemplo 7.1 obtuvimos la media y varianza de la variable aleatoria Y con base 
en una muestra de tamano 3 tomada de una poblacion conocida, la asociada con lanzar al aire un dado 
balanceado. Recuerde que si Y denota el numero de puntos observados en la cara superior en un solo tiro 
de un dado balanceado, como en el Ejercicio 3.22, 

PIT =0 = 1/6, i = 1,2,..., 6, 
p. = E(Y) = 3.5, 

Var(E) = 2.9167. 

Use la aplicacion DiceSample (en www.thomsonedu.com/statistics/wackerly) para completar lo si¬ 
guiente: 

a Use el boton “Roll One Set” para tomar una muestra de tamano 3 de la poblacion de tiros de dados. 
^,Que valor se obtuvo para la media de esta muestra? ^Donde cae este valor en el histograma? ^E1 va¬ 
lor obtenido es igual a uno de los posibles valores asociados con un solo tiro de un dado balanceado? 
^,Por que si o por que no? 

b Use el boton “Roll One Set” para obtener de nuevo otra muestra de tamano 3 de una poblacion de 
tiros de dados. ^Que valor se obtuvo para la media de esta nueva muestra? El valor obtenido ^es igual 
al valor obtenido en el inciso a? ^Por que si o por que no? 

c Use el boton “Roll One Set” ocho veces mas para obtener un total de diez valores de la media mues¬ 
tral. Vea el histograma de estas diez medias. ^Que se observa? ^Cuantos valores diferentes para la 
media muestral se obtuvieron? ^Que valores se observaron mas de una vez? 

d Use el boton “Roll 10 Sets” hasta obtener o graficar 100 valores realizados para la media mues¬ 
tral, Y . (,Que puede observar acerca de la forma del histograma de los 100 valores recabados? 
Haga clic en el boton “Show Stats” para ver la media y la desviacion estandar de los 100 valores 
(7i> 72’ • • • ’ 7ioo) que se observaron. ^Como se compara el promedio de los 100 valores de y ; , i = 
1,2,..., 100 con E(Y), el numero esperado de puntos en un solo tiro de un dado balanceado? 
(Observe que la media y la desviacion estandar de Y que usted calculo en el Ejercicio 3.22 se dan en 
la segunda lmea de la pantalla de selection “Stat Report”.) 

e ^Como se compara la desviacion estandar de los 100 valores de v,-, i = 1,2,..., 100 con la desvia¬ 
cion estandar de Y dada en la segunda lrnea de la pantalla de selection “Stat Report”? 

f Haga clic en el boton “Roll 1000 Sets” unas cuantas veces, observando cambios en el histograma a 
medida que genere mas y mas valores de la media muestral. ^Como se compara el histograma resul- 
tante con la grafica dada en la Figura 7.1(a)? 
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7.2 Consulte el Ejemplo 7.1 y el Ejercicio 7.1. 

a Use el metodo del Ejemplo 7.1 para hallar el valor exacto de P(Y = 2). 

b Consulte el histograma obtenido en el Ejercicio 7.1(d). ^,C6mo se compara la frecuencia relativa que 
usted observo Y = 2, con su respuesta al inciso a? 

c Si usted fuera a generar 10,000 valores de Y , ^que espera obtener para la frecuencia relativa de ob- 
servar Y = 2? 

7.3 Ejercicio Applet Consulte el Ejercicio 7.1. Use la aplicacion DiceSample y arrastre hacia abajo a la 
siguiente parte de la pantalla que corresponde a tomar muestras de tamano n = 12 de la poblacion co- 
rrespondiente a lanzar un dado balanceado. 

a Tome una sola muestra de tamano n = 12 al hacer clic en el boton “Roll One Set”. Use el boton “Roll 
One Set” para generar nueve valores mas de la media muestral. ^Como se compara el histograma 
de valores observados de la media muestral con el histograma observado en el Ejercicio 7.1(c) que 
estuvo basado en diez muestras cada una de tamano 3? 

b Use el boton “Roll 10 Sets” nueve veces mas hasta obtener una grafica de 100 valores (cada uno 
basado en una muestra de tamano n = 12) para la media muestral Y. Haga clic en el boton “Show 
Stats” para ver la media y la desviacion estandar de los 100 valores (y,, y 2 ,..., y 100 ) que observo. 

i /.Como se compara el promedio de estos 100 valores de y ; , i = 1,2,... , 100 con el promedio de 
los 100 valores (con base en muestras de tamano n = 3) que obtuvo en el Ejercicio 7.1(d)? 

ii Divida la desviacion estandar de los 100 valores de y,, i = 1,2,..., 100 con base en muestras de 
tamano 12 que acaba de obtener por la desviacion estandar de los 100 valores (con base en mues¬ 
tras de tamano n = 3) que obtuvo en el Ejercicio 7.1. (,Por que espera obtener un valor cercano a 
1/2? [Sugerencia: V ( Y) = cr 2 /n.\ 

c Haga clic en el boton “Toggle Normal”. La funcion de densidad continua (verde) graficada sobre 
el histograma es la de una variable aleatoria normal con media y desviacion estandar igual a la me¬ 
dia y desviacion estandar de los 100 valores (y 1; y 2 , • • •, yioo) graficados en el histograma. ^Esta 
distribucion normal parece estar razonablemente aproximada a la distribucion descrita por el histo¬ 
grama? 

7.4 Ejercicio Applet La poblacion correspondiente a la cara superior de un solo tiro de dado balanceado 
es tal que los seis valores posibles son igualmente probables. ^Se observarfan resultados analogos a los 
obtenidos en los Ejercicios 7.1 y 7.2 si el dado no estuviera balanceado? Obtenga acceso a la aplicacion 
DiceSample y arrastre hacia abajo a la parte de la pantalla que se refiere a “Loaded Die.” 

a Si el dado esta cargado, los seis resultados posibles no son igualmente probables. ^.Cuales son las 
probabilidades asociadas con cada resultado? Haga clic en los botones “1 roll”, “10 rolls”, y/o “1000 
rolls” hasta tener una buena idea de las probabilidades asociadas con los valores 1, 2, 3, 4, 5 y 6. 
^Cual es la forma general del histograma que obtuvo? 

b Haga clic en el boton “Show Stats” para ver los verdaderos valores de las probabilidades de los seis 
valores posibles. Si Y es la variable aleatoria que denota el numero de puntos en la cara superior, 
^cual es el valor para gL = E{Y)1 ^.Cual es el valor de cr, la desviacion estandar de T? [Sugerencia: 
estos valores aparecen en la pantalla “Stat Report”.] 

c ^.Cuantas veces simulo usted tirar el dado en el inciso a? ^Como se comparan la media y la desviacion 
estandar de los valores simulados con los verdaderos valores p. = E(Y) y cr? Sirnule 2000 tiros mas 
y conteste la misma pregunta. 

d Arrastre hacia la parte de la pantalla marcada “Rolling 3 Loaded Dice”. Haga clic en el boton “Roll 
1000 Sets” hasta haber generado 3000 valores observados para la variable aleatoria Y. 
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i ^Cual es la forma general de la distribucion muestral simulada que obtuvo? 

ii ),Como se compara la media de los 3000 valores y u y 2 ,..., y 3 000 con e l valor de pt = E(Y) calcu- 
lada en el inciso a? ^Como se compara la desviacion estandar de los 3000 valores con cr/V3? 

e Arrastre a la parte de la pantalla marcada “Rolling 12 Loaded Dice”. 

i En el inciso ii, usted usara la aplicacion breve para generar 3000 muestras de tamano 12, calculara 
la media de cada muestra observada y graficara estas medias en un histograma. Antes de usar la 
aplicacion, pronostique el valor aproximado que obtendra para la media y desviacion estandar de 
los 3000 valores de y que esta por generar. 

ii Use la aplicacion para generar 3000 muestras de tamano 12 y obtener el histograma asociado con 
las medias muestrales respectivas, y t , i = 1,2,..., 3000. ^Cual es la forma general de la distri¬ 
bucion muestral simulada que obtuvo? Compare la forma de esta distribucion muestral simulada 
con la que obtuvo en el inciso d. 

iii Haga clic en el boton “Show Stats” para observar la media y la desviacion estandar de los 3000 
valores y 1 , y 2 , ■ ■ ■ , ^ 3000 - (.Como se comparan estos valores con los que usted pronostico en el 
inciso i? 

Ejercicio Applet ^Que aspecto tiene la distribucion de muestreo de la media muestral si las muestras se 
toman de una distribucion aproximadamente normal? Use el applet Sampling Distribution of the Mean 
(en www.thomsonedu.com/statistics/wackerly) para completar lo siguiente. La poblacion de la que se 
obtendran las muestras esta distribuida aproximadamente en forma normal con pt = 16.50 y <x = 6.03 
(estos valores se proporcionan arriba del histogramapoblacional y estan denotados como My S, respec- 
tivamente). 

a Use el boton “Next Obs” para seleccionar un solo valor de la poblacion aproximadamente normal. 
Haga clic cuatro veces en el boton para completar una muestra de tamano 5. iQue valor obtuvo para 
la media de esta muestra? Localice este valor en el histograma del fondo (el histograma para los 
valores de Y). 

b Haga clic en el boton “Reset” para borrar la grafica del centra. Haga clic en el boton “Next Obs” 
cinco veces mas para obtener otra muestra de tamano 5 de la poblacion. (,Que valor obtuvo para la 
media de esta nueva muestra? El valor que obtuvo ),es igual al obtenido en el inciso a? (,Por que sf o 
por que no? 

c Use el boton “1 Sample” ocho veces mas para obtener un total de diez valores de la media muestral. 
Vea el histograma de estas diez medias. 

i (,Que observa? 

ii ),C 6 mo se compara la media de estos 10 valores y con la media poblacional q,? 

d Use el boton “1 Sample” hasta que haya obtenido y graficado 25 valores para la media muestral Y , 
cada uno basado en una muestra de tamano 5. 

i (,Que observa acerca de la forma del histograma de los 25 valores de y, i = 1,2, ..., 25? 

ii ),Como se compara el valor de la desviacion estandar de los 25 valores y con el valor teorico para 
try obtenido en el Ejemplo 5.27, donde demostramos que si Y se calcula con base en una muestra 
de tamano n, entonces V(Y) = cr 2 / n? 

e Haga clic en el boton “1000 Samples” unas cuantas veces, observando cambios en el histograma a 
medida que genere mas y mas valores de la media muestral. (,Que observa acerca de la forma del 
histograma resultante para la distribucion muestral simulada de L? 

f Haga clic en el boton “Toggle Normal” para recubrir (en verde) la distribucion normal con la misma 
media y desviacion estandar que el conjunto de valores de Y que previamente genera. ^Esta distribu¬ 
cion normal parece ser una buena aproximacion de la distribucion muestral de L? 
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7.6 Ejercicio Applet ^Cual es el efecto del tamano muestral en la distribucion muestral de T? Use el applet 
SampleSize para completar lo siguiente. Como en el Ejercicio 7.5, la poblacion de la que se obtendran 
las muestras esta distribuida normalmente en forma aproximada con /j, = 16.50 y <x = 6.03 (estos valo- 
res seproporcionan arribadel histograma de poblacion y se denotan como My S, respectivamente). 

a Use las flechas arriba/abajo en la caja izquierda “Sample Size” para seleccionar uno de los tamanos 
muestrales pequenos disponibles y las flechas de la caja derecha “Sample Size” para seleccionar un 
tamano muestral mas grande. 

b Haga clic en el boton “1 Sample” unas cuantas veces. ^Que semejanzas existen entre los dos histo- 
gramas que genera? ^Que diferencias hay entre ellos? 

c Haga clic en el boton “1000 Samples” unas cuantas veces y conteste las preguntas del inciso b. 

d Las medias y las desviaciones estandar de las dos distribuciones muestrales ^estan cercanas a los 
valores que esperaba? [Sugerencia: V(Y) = a 2 /n.\ 

e Haga clic en el boton “Toggle Normal”. ^Que observa acerca de lo adecuado de la aproximacion de 
las distribuciones normales? 

7.7 Ejercicio Applet ^Que aspecto tiene la distribucion de muestreo de la varianza muestral si obtenemos 
muestras de una poblacion con una distribucion aproximadamente normal? Averigiielo usando el applet 
Sampling Distribution of the Variance (Mound Shaped Population) (en www.thomsonedu.com/statis- 
tics/wackerly) para completar lo siguiente. 

a Haga clic en el boton “Next Obs” para tomar una muestra de tamano 1 de la poblacion con distribu¬ 
cion representada por el histograma de la parte superior. El valor obtenido se grafica en el histograma 
central. Haga clic cuatro veces mas para completar una muestra de tamano 5. El valor de la varianza 
muestral se calcula y se proporciona arriba del histograma central. ^,E1 valor de la varianza muestral 
es igual al valor de la varianza poblacional? ^,Le sorprende esto? 

b Cuando complete el inciso a, el valor de la varianza muestral tambien se grafica en el histograma de la 
parte mas baja. Haga clic en el boton "Reset” y repita el proceso del inciso a para generar un segundo 
valor observado para la varianza muestral. ^Obtuvo el mismo valor que observo en el inciso a? (,Por 
que sf o por que no? 

c Haga clic en el boton “1 Sample” unas cuantas veces. Observara que diferentes muestras llevan a 
valores diferentes de la varianza muestral. Haga clic en el boton “1000 Samples” unas cuantas veces 
para generar rapidamente un histograma de los valores observados de la varianza muestral (con base 
en muestras de tamano 5). ^Cual es la media de los valores de la varianza muestral que genera? ^La 
media es cercana al valor de la varianza poblacional? 

d En los ejercicios previos de esta section usted obtuvo distribuciones muestrales simuladas para la 
media muestral. Todas estas distribuciones muestrales fueron bien aproximadas (para tamanos mues¬ 
trales grandes) por una distribucion normal. Aun cuando la distribucion que obtuvo tiene forma de 
campana, ^la distribucion muestral de la varianza muestral parece ser simetrica (como la distribucion 
normal)? 

e Haga clic en el boton “Toggle Theory” para recubrir la funcion de densidad teorica para la distri¬ 
bucion muestral de la varianza de una muestra de tamano 5 tomada de una poblacion normalmente 
distribuida. ^La densidad teorica da una aproximacion razonable a los valores representados en el 
histograma? 

f El teorema 7.3, en la section siguiente, indica que si una muestra aleatoria de tamano n se toma de 
una poblacion normalmente distribuida, entonces (n - 1 )S 2 /cr 2 tiene una distribucion \ 2 con (n— 1) 
grados de libertad. ^Este resultado parece consistente con lo que observo en los incisos dye? 
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7.8 Ejercicio Applet ^.Cual es el efecto del tamano de la muestra en la distribucion muestral de S 2 ? Use la 
aplicacion VarianceSize para completar lo siguiente. A1 igual que en algunos ejercicios previos, la po- 
blacion por muestrear esta distribuida normalmente en forma aproximada con /u. = 16.50 y cr = 6.03. 

a ^Cual es el valor de la varianza poblacional cr 2 ? 

b Use las flechas arriba/debajo de la caja izquierda “Sample Size” para seleccionar uno de los peque- 
nos tamanos muestrales disponibles, y las flechas de la caja derecha “Sample Size” para seleccionar 
un tamano muestral mas grande. 

i Haga clic en el boton “1 Sample” unas pocas veces. ^.Que hay de semejante en los dos histogramas 
que genero? c,Que es diferente en ellos? 

ii Haga clic en el boton “1000 Samples” unas pocas veces y conteste las preguntas del inciso i. 

iii Las medias de las dos distribuciones muestrales ^son cercanas al valor de la varianza poblacional? 
^Cual de las dos distribuciones muestrales exhibe menor variabilidad? 

iv Haga clic en el boton “Toggle Theory”. ^Que observa acerca de lo adecuado de las distribuciones 
teoricas que aproximan? 

c Seleccione tamanos muestrales de 10 y 50 para una nueva simulacion y haga clic en el boton “1000 
Samples” unas pocas veces. 

i c,Cual de las distribuciones muestrales parece ser mas semejante a una distribucion normal? 

ii Consulte el Ejercicio 7.7(f). En el Ejercicio 7.97 usted demostrara que, para un gran numero de 
grados de libertad, la distribucion puede ser aproximada por una distribucion normal. ^Parece 
esto razonable con base en su simulacion actual? 


7.2 Distribuciones muestrales relacionadas 
con la distribucion normal 

Ya senalamos que muchos de los fenomenos observados en el mundo real tienen distribucio¬ 
nes de frecuencia relativas que se pueden modelar en forma adecuada con una distribucion de 
probabilidad normal. Por tanto, en muchos problemas practicos es razonable suponer que las 
variables aleatorias observables en una muestra aleatoria, Tj, Y 2 , . . . , Y n , son independientes 
con la misma funcion de densidad normal. En el Ejercicio 6.43 se establecio que el estadlstico 
Y = (l/n)(Fi + Yi + • • • + Y n ) en realidad tiene una distribucion normal. Como este resulta- 
do se utiliza frecuentemente en nuestras exposiciones subsecuentes, lo presentamos formal- 
mente en el siguiente teorema. 


TEOREMA 7.1 Sea Tj, Y 2 , . . . , Y n una muestra aleatoria de tamano n de una distribucion normal con 
media /j, y varianza cr 2 . Entonces 



esta distribuida normalmente con media /x-p = /jl v varianza cr 2 = a 2 /n. 
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Demostracion 


EJEMPLO 7.2 


Como lj, Y 2 ,... ,Y n es una muestra aleatoria de una distribucion normal con media /x y 
varianza a 2 , Y t ,i = 1,2,... ,n son variables independientes distribuidas normalmente, 
con E(Y '■) = /x y V(Y t ) = a 2 . Ademas, 

-1^1 1 1 

Y=-Y,Yi= ~(Yi) + -<T 2 ) + ''' + ~(Y n ) 
n n n n 

l =1 

= ci\Y\ + aiY 2 + - E a„Y n , donde a,- = 1/ n, i = 1, 2,..., n. 


Asr, Y es una combinacion lineal de lj, Y 2 , . . . , Y n , y se puede aplicar el Teorema 6.3 
para concluir que Y esta distribuida normalmente con 


E(Y) = E 


-(TO + • • • + -(F„) 
n n 


1 1 

= -(/x)+ • • • + — (/x) = /x 
n n 


V(Y) = V 


~(Yi) + 

n 


+ ~(Y„) 
n 


1 , 1 , 

= — (o~) + • • • + —(a-) 


1 , 0 " 
= — (no-) = 
n A n 


Esto es, la distribucion muestral de Y es normal con media /x K = /x y varianza 

2 2 / 

O'y - O' /«■ 


Observe que la varianza de cada una de las variables aleatorias Y l? Y 2 , . . . , Y n es a 2 y 
la varianza de la distribucion muestral de la variable aleatoria Y es <j 2 /n. En lo sucesivo, 
habra oportunidad de referirnos a estas dos varianzas. Conservaremos la notacion a 2 para 
la varianza de las variables aleatorias Y { , Y 2 , . . . , Y n , y tr 2 se usara para denotar la varianza 
de la distribucion muestral de la variable aleatoria Y. De manera analoga , <r sera conservada 
como la notacion para la desviacion estandar de las Y t , y la desviacion estandar de la distribu¬ 
cion muestral de Y se denota oy. 

De acuerdo con las condiciones del Teorema 7.1, Y esta normalmente distribuida con me¬ 
dia /jLy = /x y varianza a 2 = cr 1 /n. Se deduce que 

„ Y — /Xy Y-fi /- (y — /x 

Z =- = —— =V« - 

ay a/\'n \ a 

tiene una distribucion normal estandar. Ilustraremos la aplicacion del Teorema 7.1 con el 
siguiente ejemplo. 


Una maquina embotelladora puede ser regulada para que descargue un promedio de /x on- 
zas por botella. Se ha observado que la cantidad de liquido dosificado por la maquina esta 
distribuida normalmente con cr = 1.0 onza. Una muestra de n = 9 botellas se selecciona 
aleatoriamente de la produccion de la maquina en un dfa determinado (todas embotelladas 
con el mismo ajuste de la maquina) y las onzas de contenido liquido se miden para cada una. 
Determine la probabilidad de que la media muestral se encuentre a no mas de .3 onza de la 
verdadera media /x para el ajuste seleccionado de la maquina. 
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Solucion Si Y x , Y 2 ,. . . ,Y g denota el contenido en onzas de las botellas que se van a observar, entonces 
sabemos que las Y i estan distribuidas normalmente con media jj, y varianza a 2 = 1 para i = 1, 
2,... ,9. Por tanto, por el Teorema 7.1, K posee una distribucion muestral normal con media 
IJ-Y = MY varianza crl = er 2 /n = 1 /9. Deseamos hallar 

P(\Y - n\ < .3) = P[-.3 < (Y - n) < .3] 

y cr/\/n cr/y/n a/y/n J 

Como (Y — i±y)f<ry = (Y — n)/{cr/’s/n) tiene una distribucion normal estandar, se deduce 
que 

P(|7-/a|< .3) = P ( - <Z< | 

V 1/V9 1/V9/ 

= P(—.9 < Z < .9). 

Usando la Tabla 4, Apendice 3, encontramos 

P{—.9 < Z < .9) = 1 - 2P(Z > .9) = 1 - 2(, 1841) = .6318. 

Por consiguiente, la probabilidad es solo .6318 de que la media muestral se encuentre a no 
mas de .3 onza de la verdadera media poblacional. ■ 


EJEMPLO 7.3 Consulte el Ejemplo 7.2. ^Cuantas observaciones deben estar incluidas en la muestra si desea¬ 
mos que Y se encuentre a no mas de .3 onza de /l con probabilidad de .95? 

Solucion Ahora buscamos 

P(|7 -fi | < .3) = P[—.3 < (Y - /i) < .3] = .95. 

Si dividimos cada termino de la desigualdad entre cry = cr /\/ii (recuerde que cr = 1), tene- 


r -- 3 ^ 


- ' 3 1 

cr /y/n 

[cr/Vn J 

cr /y/n 


= P(-.3Vn < Z < 3Vn) = .95 


Pero con el uso de la Tabla 4, Apendice 3, obtenemos 

P( —1.96 < Z < 1.96) = .95. 


Esto nos dice que 

• 3Vn = 1-96 o bien, lo que es equivalente, n 



42.68. 


Desde una perspectiva practica, es imposible tomar una muestra de tamano 42.68. Nuestra so¬ 
lucion indica que una muestra de tamano 42 no es suficientemente grande para llegar a nuestro 
objetivo. Si n = 43, P(\ Y — /jl\ < .3) es ligeramente mayor que .95. ■ 
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En los capitulos siguientes centraremos nuestra atencion en los estadfsticos que son funcio- 
nes de los cuadrados de las observaciones en una muestra aleatoria procedente de una pobla- 
cion normal. El Teorema 7.2 establece la distribucion muestral de la suma de los cuadrados de 
variables aleatorias normales estandar e independientes. 


TEOREMA 7.2 


Demostracion 


Si Tj, Y 2 ,, Y n esta definida como en el Teorema 7.1. Entonces Z ; = (T). — /x)/cr son 
variables aleatorias normales estandare independientes, i = 1,2,... ,n,y 



tienen una distribucion x~ con n grados de libertad (gl). 


Como Y U Y 2 ,..., Y n es una muestra aleatoria de una distribucion normal con media /x y 
varianza cr 2 , el Ejemplo 6.10 implica que Z i = (Y t - j±)f (t tiene una distribucion normal 
estandar para i = 1, 2, . . . , n. Ademas, las variables aleatorias Z ; son independientes 
porque las Y t de las variables aleatorias son independientes, i = 1,2,..., n. El hecho de 
que Y^'‘= i Z 2 tiene una distribucion x~ con n grados de libertad se deduce directamente 
del Teorema 6.4. 


En la Tabla 6, Apendice 3, podemos hallar valores Xa de modo que 


P(x 2 >xl)=a 


para variables aleatorias con distribuciones x 2 (vease Figura 7.2). Por ejemplo, si la varia¬ 
ble aleatoria de interes x 2 tiene 10 grados de libertad, la Tabla 6 del Apendice 3 se puede 
usar para hallar x\q. Para hacerlo, vea en el renglon marcado 10 gl y la columna con en- 
cabezado x 2 go y lea el valor 4.86518. Por tanto, si Y tiene una distribucion x 2 con 10 gl- 
P(Y > 4.86518) = .90. Se deduce que P(Y < 4.86518) = .10 y que 4.86518 es el cuantil .10, 
cf> 10 , de una variable aleatoria x 2 con 10 gl. En general, 

P (x 2 > Xa) = a implica que P ( X 2 < Xa) = 1 - « 

y que Xa = 4>\-a, el cuantil (1 — a) de la variable aleatoria x 2 - 

La Tabla 6, Apendice 3, contiene Xa = 4>\-a para diez valores de a (.005, .01, .025, .05, 
.1, .90, .95, .975, .99 y .995) para cada una de las 37 distribuciones x 2 diferentes (aquellas 
con grados de libertad 1, 2, . . . , 30 y 40, 50, 60, 70, 80, 90 y 100). Considerablemente mas 
informacion acerca de estas distribuciones y la asociada con grados de libertad no incluidos 


FIGURA 7.2 
Una distribucion x 2 
que muestra el area a 
de cola superior 



U 


0 
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en la tabla, se encuentra en software estadfstico que se puede adquirir. Si Y tiene una distribu¬ 
cion x 2 con v grados de libertad, el comando pchisq (yo, v ) de R (y .S’-Plus) da P(Y < y Q ) 
mientras que qchisq ( p , v ) da el p-esimo cuantil, el valor cf> p tal que P(Y < <f> ) = p. Las 
probabilidades y los cuantiles asociados con variables aleatorias \ 2 tambien se pueden obtener 
facilmente usando la aplicacion Chi-Square Probabilities and Quantiles (disponible en www. 
thomsonedu.com/statistics / wackerly). 

El siguiente ejemplo ilustra el uso combinado del Teorema 7.2 y las tablas x~- 


EJ EM P LO 7.4 Si Zj, Z 2 ,. . ., Z 6 denota una muestra aleatoria proveniente de la distribucion normal estandar, 
encuentre un numero b tal que 

= - 95 - 

Solucion Por el Teorema 7.2, zj tiene una distribucion \ 2 con 6 grados de libertad. Si vemos la 
Tabla 6, Apendice 3, en la fila con encabezado 6 gl y la columna con encabezado Xx> 5 > vemos 
el numero 12.5916. Por tanto, 


P 



> 12.5916 


.05, o bien, lo que es equivalente, P 



12.5916 


.95, 


y b = 12.5916 es el cuantil .95 (95o. percentil) de la suma de los cuadrados de seis variables 
aleatorias normales estandar e independientes. ■ 


La distribucion x~ desempena una importante funcion en muchos procedimientos inferen- 
ciales. Por ejemplo, suponga que deseamos hacer una inferencia acerca de la varianza pobla- 
cional cr 2 basada en una muestra aleatoria Y x , Y 2 , . . . , Y n de una poblacion normal. Como lo 
demostraremos en el Capitulo 8, un buen estimador de cr es la varianza muestral 


S 2 



- P) 2 - 

i =1 


El siguiente teorema proporciona la distribucion de probabilidad para una funcion del esta- 
distico S 2 . 


TEOREMA 7.3 


Sea 7j, Y 2 , . . . , Y n una muestra aleatoria de una distribucion normal con media /x y 
varianza cr 2 . Entonces 


(n - 1 )S 2 


1 



- P) 2 

i = l 


tiene una distribucion x 2 con (n— 1) gl. Tambien, Y y S 2 son variables aleatorias inde¬ 
pendientes. 
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Demostracion 


La demostracion completa de este teorema aparece en el Ejercicio 13.93. Para enten- 
der mejor el resultado general, consideraremos el caso n = 2 y demostraremos que 
(n - 1 )S 2 /a 2 tiene una distribucion x~ con 1 gl. En el caso de n = 2, 

Y = (1/2X7! + Y 2 ), 


y, por tanto. 


S 2 = 


i = i 


Pi ~ -(Y\ + Y 2 ) 


+ 


-i2 


P 2 - ^(Yx + Y 2 ) 


2 (Fl - F2) 


= 2 


+ 

-,2 


2 (Fl - F2) 


2 (FZ " Fl) 

(Pi - P 2 ) 2 


Se deduce que, cuando n = 2, 


(» ~ PS 2 = (Pi ~ Y 2 ) 2 __ (Y x ~ Y 2 
o- 2 2cr 2 


Demostraremos que esta cantidad es igual al cuadrado de una variable aleatoria nor¬ 
mal estandar; es decir, se trata de una variable Z 2 que, como ya hemos demostrado en el 
Ejemplo 6.11, posee una distribucion x 2 con 1 grado de libertad. 

Como Lj - Y 2 es una combinacion de variables aleatorias independientes distribuidas 
normalmente (K, — Y 2 = a l Y l + a 2 Y 2 con a ] = 1 y a 2 = -1), el Teorema 6.3 nos dice 
que Fj — Y 2 tiene una distribucion normal con media 1 /a — 1/a = 0 y varianza (l) 2 cr 2 + 
(-l) 2 o- 2 = 2a 2 . Por tanto. 


V2cr 2 

tiene una distribucion normal estandar. Como para n = 2 

(n-l)S 2 _ /Pi -P 2 \ 2 _ 

^ 2 V V2^ ) 

se deduce que (n — 1 )S 2 /a 1 tiene una distribucion x~ con 1 grado de libertad. 

En el Ejemplo 6.13 demostramos que U l = (Pj + Y 2 )/a y U 2 = (Y ] — Y 2 )/a son 
variables aleatorias independientes. Observe que, debido a que n = 2, 

Y, + Y 2 aU, c2 (Yx - F 2 ) 2 (aU 2 ) 2 

2 2 2 2 


Como P solo es una funcion de U l y .S' 2 es una funcion de U 2 , la independencia de U l y 
U-, implica la independencia de P y S 2 . 
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EJEMPL0 7.5 Enel Ejemplo 7.2, se supone que las onzas de lfquido que vierte la maquina embotelladora 
tienen una distribucion normal con cr 2 = 1. Suponga que planeamos seleccionar una muestra 
aleatoria de diez botellas y medir la cantidad de lfquido en cada una. Si estas diez observacio- 
nes se usan para calcular S 2 , podrfa ser util especificar un intervalo de valores que incluiran S 2 
con una probabilidad alta. Encuentre numeros b , y b 2 tales que 

P(bi < S 2 < b 2 ) = .90. 


Solucion Observe que 


P(b x <S 2 <b 2 ) = P 


(n — l)b\ (n-l)S 2 (n-l)b 2 


Debido a que cr 2 = 1, se deduce que (n - I )S 2 /a 2 = (n - I ).S' 2 tiene una distribucion x 2 con 
(n — 1) grados de libertad. Por tanto, podemos usar la Tabla 6, Apendice 3, para hallar dos 
numeros a ] y a 2 tales que 


P[a i <(« - 1 )S 2 <a 2 ] = .90. 


Un metodo para hacer esto es encontrar el valor de a-, que delimite un area de .05 en la cola 
superior y el valor de a 1 que delimite .05 en la cola inferior (.95 en la cola superior). Como hay 
n — 1 =9 grados de libertad, la Tabla 6 del Apendice 3 indica que a 2 = 16.919 y a l = 3.325. 
En consecuencia, los valores para b { y b n que satisfacen nuestras condiciones estan dados 
por 


3.325 = a\ = 


16.919 =a 2 = 


(n 

~ l)bi 

= 9 by 

o b\ = 

3.325 


a 2 

9 

(n 

- 1)*2 

= 9b 2 

o b 2 = 

16.919 


cr 2 

9 


= .369 y 
= 1.880. 


Por tanto, si deseamos tener un intervalo que incluya S 2 con probabilidad .90, uno de estos 
intervalos es (.369, 1.880). Observe que este intervalo es bastante amplio. ■ 


El resultado del Teorema 7.1 proporciona la base para el desarrollo de procedimientos 
que permiten hacer inferencias acerca de la media /i de una poblacion normal con varianza 
conocida cr 2 . En dicho caso, el Teorema 7.1 indica que \/n(Y — j ±)/cr tiene una distribucion 
normal estandar. Cuando cr no se conoce, puede ser estimada con S = VS 2 y la cantidad 



proporciona la base para desarrollar metodos de inferencia respecto de /j.. Demostraremos 
que \/n(Y — fi)/S tiene una distribucion conocida como distribucion t de Student con n - 1 
grados de libertad. La definicidn general de una variable aleatoria que posee una distribucion 
t de Student (o simplemente una distribucion t) es la siguiente. 














360 Capftulo 7 Distribuciones muestrales y el teorema del Ifmite central 


DEFINICION 7.2 


F I G U R A 7.3 
Comparacion 
de las funciones de 
densidad normal 
estandar y t 


Sea Z una variable aleatoria normal estandar y sea W una variable con distribution x 2 
con v grados de libertad. Entonces, si W v Z son independientes, 


T = 


Z 

VWfi 


se dice que tiene una distribution t con v grados de libertad. 


Si Pj, Y 2 , . . . , Y n constituye una muestra aleatoria de una poblacion normal con media /jl 
y varianza cr 2 , el Teorema 7.1 puede aplicarse para demostrar que Z = yfn (Y — /jl)/ct tiene 
una distribution normal estandar. El Teorema 7.3 nos dice que W = (n — I )S 2 /<r 2 tiene una 
distribucion x 2 con v = n - 1 grados de libertad y que Z y W son independientes (puesto que 
Y y S 2 son independientes). Por tanto, segun la Definition 7.2, 

j = Z _ \/n(Y - itija = v ^- / Y -fi 

VWA 7 J[(„ - 1 )S 2 /a 2 ]/(n - 1) \ 5 

tiene una distribucion t con (n - 1) grados de libertad. 

La ecuacion para la funcion de densidad t no se dara aqui, pero se puede hallar en el 
Ejercicio 7.98 donde se dan sugerencias acerca de su deduction. A1 igual que la funcion de 
densidad normal estandar, la funcion de densidad t es simetrica alrededor de cero. Ademas, 
para v > 1, E(T) = 0; y para v > 2, V(T) = v/(v - 2). Estos resultados se deducen directa- 
mente de los obtenidos en los Ejercicios 4.111 y 4.112 (vease Ejercicio 7.30). De esta manera, 
vemos que, si v > 1, una variable aleatoria con distribucion t tiene el mismo valor esperado 
que una variable aleatoria normal estandar. No obstante, una variable aleatoria normal estan¬ 
dar siempre tiene una varianza 1 mientras que, si v > 2, la varianza de una variable aleatoria 
con una distribucion t siempre es mayor que 1. 

La figura 7.3 muestra la grafica de una funcion de densidad normal estandar y una funcion 
de densidad t. Observe que ambas funciones de densidad son simetricas alrededor del origen 
pero que la densidad t tiene mas masa de probabilidad en sus extremos. 

Los valores de t a tales que P(T > t a ) = a se dan en la Tabla 5, Apendice 3. Por ejemplo, 
si una variable aleatoria tiene una distribucion t con 21 grados de libertad, t wo se encuentra 
viendo el renglon marcado 21 gl (grados de libertad) y la columna con encabezado 1 100 . Con 
el uso de la Tabla 5, vemos que 1 100 = 1.323 y que para 21 grados de libertad, P(T > 1.323) 
= .100. Se deduce que 1.323 es el cuantil .90 (el 90o. percentil) de la distribucion t con 21 
grados de libertad y en general que t a = el cuantil (1 - a) [el percentil 100(1 - a)-esimo] 
de una variable aleatoria de distribucion t. 
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EJEMPLO 7.6 


Solucion 


La Tabla 5, Apendice 3, contiene t a = (p^ para cinco valores de a (.005, .010, .025, .050 y 
.100) y 30 distribuciones t diferentes (aquellas congrados delibertad 1,2,..., 29 eoo). De ma- 
nera considerable mas informacion acerca de estas distribuciones y las asociadas con grados 
de libertad no incluidos en la tabla, es proporcionada por software estadfstico comercialmente 
disponible. Si Y tiene una distribucion t con v grados de libertad, el comando pt (y () , v ) de 
R (y 5-Plus) da P(Y < v 0 ) mientras que qt (p, u) da el p-esimo cuantil, el valor de <p p tal 
que P(Y < <p p ) = p. Las probabilidades y cuantiles asociados con variables aleatorias con 
distribucion 1 tambien se pueden obtener facilmente utilizando la aplicacion breve Student’s 
Probabilities and Quantiles (en www.thomsonedu.com/statistics/wackerly). 


La resistencia a la tension para un tipo de alambre esta distribuida normalmente con media 
desconocida p y varianza desconocida a 2 . Seis trozos de alambre se seleccionan aleatoria- 
mente de un rollo largo; Y v la resistencia a la tension para el trozo i, se mide para i = 1,2,... 
, 6. La media poblacional p y la varianza cr pueden ser estimadas por Y y S 2 , respectivamente. 
Como <jl = cr 2 /a, se deduce que cr 2 puede ser estimada por S 2 /n. Encuentre la probabilidad 
aproximada de que Y este dentro de 2 Sj\/n de la verdadera media poblacional p. 


Deseamos hallar 

- 2SVI (^) S2 _ 

= P(-2 < T < 2), 

donde T tiene una distribucion t con, en este caso, n— 1=5 grados de libertad. A1 observar 
la Tabla 5, Apendice 3, vemos que el area de la cola superior a la derecha de 2.015 es .05. En 
consecuencia, 


r 2 S - 251 


~~t= —(.Y — p) < — 

v« v«. 

= p 


P(-2.015 < 2.015) = .90, 

y la probabilidad de que Y este a no mas de 2 desviaciones estandar estimadas de p es lige- 
ramente menor que .90. En el Ejercicio 7.24 el valor exacto para P(-2 < T < 2) se hallara 
usando la aplicacion Student’s Probabilities and Quantiles disponible en www.thomsonedu. 
com/statistics / wackerly. 

Observe que si cr 2 se conociera, la probabilidad de que Y este a no mas de 2<t y de p estarla 
dada por 



(Y-p)< 2 



= P 


-2 I 


■ P 


<2 


= P(-2 < Z <2) = .9544. ■ 


Suponga que queremos comparar las varianzas de dos poblaciones normales con base en 
informacion contenida en muestras aleatorias independientes provenientes de las dos pobla¬ 
ciones. Tomemos muestras de tamano n , y n 2 dc las dos poblaciones con varianzas cr/ y cr|, 
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respectivamente. Si calculamos Sf de las observaciones en la muestra 1, entonces Sf calcula 
of. Del mismo modo, Sf calculada de las observaciones en la segunda muestra calcula of. 
Entonces, parece que la razon S\/Sf podria usarse para hacer inferencias acerca de las magni¬ 
tudes relativas de of y of. Si dividimos cada Sf entre of, entonces la razon resultante 

S AK = (d\ 

Sf/erf UV UV 

tiene una distribution F con (n, - 1) grados de libertad en el numerador y (n 2 — 1) grados 
de libertad en el denominador. La definicion general de una variable aleatoria que posee una 
distribucion F aparece a continuacion. 


DEFINICION 7.3 Sean W l y W 2 variables aleatorias independientes con distribucion x 2 , con v , y v 2 grados 
de libertad, respectivamente. Entonces se dice que 

F = Wi/vi 
W2/V2 

tiene una distribucion F con iq grados de libertad en el numerador y v 2 grados de liber¬ 
tad en el denominador. 


La funcion de densidad para una variable aleatoria con distribucion F se proporciona en el 
Ejercicio 7.99 donde el metodo para su deduccion esta indicado. Se puede demostrar (vease 
el Ejercicio 7.34) que si F posee una distribucion F con rq grados de libertad en el numerador 
y v 2 en el denominador, entonces E(F) = v 2 /{v 2 ~ 2) si v 2 > 2. Tambien, si v 2 > 4, entonces 
V(F) = [2if (iq + V 2 — 2)]/[v\{v2 — 2) 2 (v2 — 4)]. Observe que la media de una variable 
aleatoria con distribucion F depende solo del ntimero de grados de libertad v 2 del denomi¬ 
nador. 

Considerando una vez mas dos muestras aleatorias independientes tomadas de distribucio¬ 
nes normales, sabemos que W\ = (n 1 — I ).Sf /of y W2 = («2 ~ I) Sf /erf tienen distribuciones 
X 2 independientes con u [ = (n l — I) y u 2 = (n 2 — 1) grados de libertad, respectivamente. 
Entonces, la Definicion 7.3 implica que 

_ Wi/vi _ [Oi - 1) S\/af\/(ni - 1) _ Sf/af 
W 2 /v 2 [(n 2 “ IjSf/of]/(n 2 - 1) Sf/crf 

tiene una distribucion F con (n ] — 1) grados de libertad en el numerador y (n 2 — 1) grados de 
libertad en el denominador. 

En la Figura 7.4 se muestra la grafica de una funcion de densidad F. Los valores de F a tales 
que P(F > F a ) = a se dan en la Tabla 7, Apendice 3, para valores de a = .100, .050, .025, 
.010 y .005. En la Tabla 7, los encabezados de las columnas son los grados de libertad del 
numerador mientras que los grados de libertad del denominador se dan en los encabezados 
del renglon principal. Opuestos a cada uno de los grados de libertad del denominador (encabe¬ 
zados de renglon), aparecen los valores de a = .100, .050, .025, .010 y .005. Por ejemplo, si la 
variable F de interes tiene 5 grados de libertad en el numerador y 7 grados de libertad en el de¬ 
nominador, entonces F 100 = 2.88, F 050 = 3.97, F 025 = 5.29, F 010 = 7.46 y Fqos = 9.52. 
Por tanto, si F tiene una distribucion F con 5 grados de libertad en el numerador y 7 grados de 
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FIGURA 7.4 
Una tfpica funcion 
de densidad de 
probabilidad F 



libertad en el denominador, entonces P(F > 7.46) = .01. Se deduce que 7.46 es el .99 cuantil 
de la distribucion F con 5 grados de libertad en el numerador y 7 grados de libertad en el de¬ 
nominador. En general, F a = </>,_„. el cuantil (1 - a) [el 100(1 - a)-esimo percentil] de una 
variable aleatoria con distribucion F. 

Para los cinco valores previamente mencionados de a, la Tabla 7, Apendice 3, proporciona 
los valores de F a para 646 distribuciones F (las de grados de libertad 1, 2,. .., 10, 12, 15, 20, 
24, 30, 40, 60, 120 e oo en el numerador y las de grados de libertad 1,2,..., 30, 40, 60, 120 e 
oo en el denominador). De forma considerable hay mas informacion acerca de estas distribu¬ 
ciones, y las asociadas con grados de libertad no incluidas en la tabla, en software estadfstico 
que se puede adquirir comercialmente. Si Y tiene una distribucion F con rq grados de libertad 
en el numerador y v 2 grados de libertad en el denominador, el comando pf (yo , v-i , v 2 ) de 
R (y .S'-Plus) da P(Y < y 0 ) mientras que qf (P , v-\ / vi) da el /;-esimo cuantil, el valor de <p p 
tal que P(Y < cf> p ) = p. Las probabilidades y cuantiles asociados con variables aleatorias de 
distribucion F tambien se pueden obtener facilmente con el uso de la aplicacion breve F-Ratio 
Probabilities and Quantiles (en www.thomsonedu.com/statistics/wackerly). 


EJ E M P L O 7.7 Si tomamos muestras independientes de tamanos n , = 6 y n 2 = 10 de dos poblaciones norma- 
les con la misma varianza poblacional, encuentre el numero b tal que 



Solucion Como n l = 6, n 2 = 10 y las varianzas poblacionales son iguales, entonces 

_ 5 ? 

Sl/crl Si 

tiene una distribucion F con v l = n { — 1 = 5 grados de libertad en el numerador v v 2 = n 2 - I 
= 9 grados de libertad en el denominador. Asimismo, 



Por tanto, queremos determinar el numero b que delimita un area en el extremo superior de .05 
bajo la funcion de densidad F con 5 grados de libertad en el numerador y 9 grados de libertad 
en el denominador. Si leemos en la columna 5 y renglon 9 de la Tabla 7, Apendice 3, vemos 
que el valor apropiado de b es 3.48. 
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Aun cuando las varianzas poblacionales son iguales, la probabilidad de que la razon entre 
las varianzas muestrales sea mayor que 3.48 todavfa es .05 (suponiendo tamanos muestrales 
de Hj = 6 y «, = 10). ■ 


Esta seccion se ha dedicado a desarrollar distribuciones muestrales de diversos estadfsticos 
calculados mediante el uso de las observaciones de una muestra aleatoria tomada de una poblacion 
normal (o muestras aleatorias independientes extrafdas de dos poblaciones normales). En par¬ 
ticular, si Y v Y 2 , ..., Y n representa una muestra aleatoria de una poblacion normal con media /j. y 
varianza a 2 , hemos visto que \/n( Y — / x )/a dene una distribucion normal estandar. Asimismo, 
(n - 1) S 2 /a 2 tiene una distribucion \ 2 y \/"n( Y — fi)/S tiene una distribucion t (ambas con n — 1 
grados de libertad). Si tenemos dos muestras aleatorias independientes de poblaciones norma¬ 
les con varianzas of y of, entonces F = (S] /(t^)/( tiene una distribucion F. Estas dis¬ 

tribuciones muestrales haran posible que podamos evaluar las propiedades de procedimientos 
inferenciales en capitulos posteriores. En la siguiente seccion examinamos las aproximacio- 
nes a ciertas distribuciones muestrales que pueden ser muy utiles cuando se desconoce la 
forma exacta de la distribucion muestral o cuando es diffcil o tedioso usar la distribucion 
muestral exacta para calcular probabilidades. 


Ejercicios 

7.9 Consulte el Ejemplo 7.2. La cantidad de lfquido dosificado por una maquina embotelladora esta distri- 
buida normalmente con <x = 1 onza. Si n = 9 botellas se seleccionan aleatoriamente de la produccion de 
la maquina, encontramos que la probabilidad de que la media muestral se encuentre a no mas de .3 onza 
de la verdadera media es .6318. Suponga que Y se ha de calcular usando una muestra de tamano n. 

a Si n = 16, ^.cual es P(\Y — /x| < .3)? 

b Encuentre /’(|y — /r|< .3) cuando Y se ha de calcular usando muestras de tamanos n = 25, n — 36, 
n = 49 y n = 64. 

c ^Que patron observa usted entre los valores para P(\Y — /r |£.3) que haya contemplado para diver¬ 
sos valores de nl 

d ^Los resultados obtenidos en el inciso b parecen ser consistentes con el resultado obtenido en el 
Ejemplo 7.3? 

7.10 Consulte el Ejercicio 7.9. Suponga ahora que la cantidad de lfquido dosificado por la maquina embote¬ 
lladora esta distribuida normalmente con cr = 2 onzas. 

a Sin = 9 botellas se seleccionan aleatoriamente de la produccion de la maquina, ^cuales/ 3 ! | Y — /jl | < .3)? 

Compare esto con la respuesta obtenida en el Ejemplo 7.2. 
b Encuentre P(\Y — /x |<.3) cuando Y se ha de determinar usando muestras de tamanos n ~ 25, n = 
36, n = 49 y n = 64. 

c ^Que patron observa usted entre los valores para P(\Y — /jl |£.3) que contemplo para los diversos 
valores de n? 

d ^Como se comparan las respectivas probabilidades obtenidas en este problema (donde a = 2) con las 
obtenidas en el Ejercicio 7.9 (donde a = 1)? 

7.11 Un guardabosque, que estudia los efectos de la fertilizacion en ciertos bosques de pinos en el sureste, 
esta interesado en estimar el promedio de area de la base de los pinos. A1 estudiar areas basales de pinos 
similares durante muchos afios, descubrio que estas mediciones (en pulgadas cuadradas) estan distri- 
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buidas normalmente con desviacion estandar aproxima de 4 pulgadas cuadradas. Si el guardabosque 
muestrea n = 9 arboles, encuentre la probabilidad de que la media muestral se encuentre a no mas de 2 
pulgadas cuadradas de la media poblacional. 

7.12 Suponga que al guardabosque del Ejercicio 7.11 le gustarfa que la media muestral estuviera a no mas 
de 1 pulgada cuadrada de la media poblacional, con probabilidad .90. ^Cuantos arboles debe medir para 
asegurar este grado de precision? 

7.13 La Environmental Protection Agency se ocupa del problema de establecer criterios para las cantidades 
de sustancias qulmicas toxicas permitidas en lagos y rfos de agua dulce. Una medida comun de toxicidad 
para cualquier contaminante es la concentration de este que matarfa a la mitad de la especie de prueba 
en un tiempo determinado (por lo general 96 horas para especies de peces). Esta medida se denomina 
CL50 (concentration letal que mata 50% de la especie de prueba). En muchos estudios, los valores 
contenidos en el logaritmo natural de mediciones del CL50 estan distribuidos normalmente y, en conse- 
cuencia, el analisis esta basado en datos del ln(CL50). 

Estudios de los efectos del cobre en cierta especie de peces (por ejemplo la especie A) muestran que 
la varianza de mediciones de ln(CL50) es alrededor de .4 con mediciones de concentration en miligra- 
mos por litro. Si han de completarse n = 10 estudios sobre el CL50 para cobre, encuentre la probabili¬ 
dad de que la media muestral de ln(CL50) difiera de la verdadera media poblacional en no mas de .5. 

7.14 Si en el Ejercicio 7.13 deseamos que la media muestral difiera de la media poblacional en no mas de .5 
con probabilidad .95, ^cuantas pruebas deben realizarse? 

7.15 Suponga que X 1 , X 2 , . . . , X m y Ej, Y 2 , . . . , Y n son muestras aleatorias independientes, con las variables 
X/ distribuidas normalmente con media /jl 1 y varianza of y las variables Y i distribuidas normalmente con 
media /jl 2 y varianza of. La diferencia entre las medias muestrales, X — E, es entonces una combination 
lineal de in + n variables aleatorias distribuidas normalmente y, por el Teorema 6.3, tiene una distribu¬ 
tion normal. 

a Encuentre E(X — E). 
b Encuentre V(X - Y). 

c Suponga que of = 2, of = 2.5 y m = n. Encuentre los tamanos muestrales para que (A — Y) se 
encuentre a no mas de 1 unidad de (/jl 1 - /jl -,) con probabilidad .95. 

7.16 Refiriendose al Ejercicio 7.13, suponga que los efectos del cobre en una segunda especie (por ejemplo la 
especie B) de peces muestran la varianza de mediciones de ln(CL50) que son de .8. Si las medias pobla- 
cionales del ln(CL50) para las dos especies son iguales, encuentre la probabilidad de que, con muestras 
aleatorias de diez mediciones de cada especie, la media muestral para la especie A sea mayor a la media 
muestral para la especie B en al menos 1 unidad. 

7.17 Ejercicio Applet Consulte el Ejemplo 7.4. Use la aplicacion breve Chi-Square Probabilities and 

Quantiles para hallar P ^ — 6^. (Recuerde que Z? tiene una distribution \ 2 con 6 grados 

de libertad.) 

7.18 Ejercicio Applet Consulte el Ejemplo 7.5. Si a 2 = 1 y n— 10, use la aplicacion Chi-Square Probabilities 
and Quantiles para hallar P(S 2 ^ 3). Recuerde que, con las condiciones dadas previamente, 9 S 2 tiene 
una distribution \ 2 con 9 grados de libertad.) 

7.19 Los amperfmetros producidos por un fabricante se venden con la especificacion de que la desviacion 
estandar de las lecturas de la aguja no sea mayor que .2 amperes. Uno de estos amperfmetros se utilizo 
para hacer diez lecturas independientes en un circuito de prueba con corriente constante. Si la varianza 
muestral de estas diez mediciones es .065 y es razonable suponer que las lecturas estan distribuidas nor¬ 
malmente, ^los resultados sugieren que el amperfmetro empleado no satisface las especificaciones del 
mercado? [Sugerencia: encuentre la probabilidad aproximada de que la varianza muestral sera mayor 
que .065 si la verdadera varianza poblacional es .04.] 
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7.20 a Si U tiene una distribucion x 2 con v grados de libertad, encuentre E(U) y V(U). 

b Usando los resultados del Teorema 7.3, encuentre E(S 2 ) y V(S 2 ) cuando Fj, F,,..., Y n es una muestra 
aleatoria de una distribucion normal con media p. y varianza a 2 . 

7.21 Consulte el Ejercicio 7.13. Suponga que n = 20 observaciones se han de tomar a mediciones ln(CL50) 
y que cr 2 = 1.4. Denote con S 2 la varianza muestral de las 20 mediciones. 

a Encuentre un numero b tal que P(S 2 £ b) = .975. 
b Encuentre un numero a tal que P(a £ S 2 ) = .975. 
c Si a y b son como en los incisos a y b, ^cual es P(a £ S 2 £ b)l 

7.22 Ejercicio Applet Como ya indicamos en la Definicion 4.10. una variable aleatoria F tiene una distribu¬ 
cion x 2 c ° n v grados de libertad si y solo si F tiene una distribucion gamma con a = v/2y fi =2. 

a Use la aplicacion Comparison of Gamma Density Functions para graficar densidades x 2 con 10, 40 
y 80 grados de libertad. 

b ^Que observa usted acerca de las formas de estas funciones de densidad? ^Cual de ellas es mas sime- 
trica? 

c En el Ejercicio 7.97 usted demostrara que para valores grandes de v, una variable aleatoria x 2 tiene 
una distribucion que puede ser aproximada por una distribucion normal con /x = v y cr —\/2u. 
^Como se comparan la media y desviacion estandar de la aproximacion a la distribucion normal con 
la media y la desviacion estandar de la variable aleatoria x~ de F? 
d Consulte las graficas de las densidades x 2 que obtuvo en el inciso a. En el inciso c dijimos que, si el 
numero de grados de libertad es grande, la distribucion x 2 se puede aproximar con una distribucion 
normal. ^,Le sorprende esto? ^Por que? 

7.23 Ejercicio Applet 

a Use la aplicacion Chi-Square Probabilities and Quantiles para determinar P[Y > E{Y)\ cuando F 
tiene distribuciones x 2 con 10, 40 y 80 grados de libertad. 
b ^Que observo usted acerca de P[Y > E(Y) \ cuando aumenta el numero de grados de libertad como en 
el inciso a? 

c ^Como se relaciona lo que usted observo en el inciso b con las formas de las densidades x 2 que ob¬ 
tuvo en el Ejercicio 7.22? 

7.24 Ejercicio Applet Consulte el Ejemplo 7.6. Suponga que T tiene una distribucion t con 5 grados de liber¬ 
tad. 

a Use la aplicacion Student’s t Probabilities and Quantiles para hallar la probabilidad exacta de que T 
sea mayor que 2. 

b Use la aplicacion Student’s t Probabilities and Quantiles para hallar la probabilidad exacta de que T 
sea menor que -2. 

c Use la aplicacion Student's t Probabilities and Quantiles para hallar la probabilidad exacta de que T 
este entre -2 y 2. 

d Su respuesta al inciso c es considerablemente menor que 0.9544 = P(- 2 £ZS 2). Consulte la figura 
7.3 y explique por que esto es como se esperaba. 

7.25 Ejercicio Applet Suponga que T es una variable aleatoria con distribucion t. 

a Si! tiene 5 grados de libertad, use la Tabla 5, Apendice 3, para hallar 1 10 , el valor tal que P(T> 1 10 ) 
= .10. Encuentre 1 10 usando la aplicacion Student's t Probabilities and Quantiles. 
b Consulte el inciso a. lA que cuantil corresponde 1 10 ? i A que percentil? 

c Use el applet Student's t Probabilities and Quantiles para hallar el valor de 1 10 para distribuciones t 
con 30, 60 y 120 grados de libertad. 
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d Cuando Z tiene una distribucion normal estandar, P(Z > 1.282) = .10 y z 10 = 1.282. ^Que propiedad 
de la distribucion t (cuando se compara con la distribucion normal estandar) explica el hecho de que 
todos los valores obtenidos en el inciso c son mayores que z 10 = 1.282? 
e ^Que se observa acerca de los tamanos relativos de los valores de 1 10 para distribuciones t con 30, 60 
y 120 grados de libertad? Calcule lo que t 10 “converge” cuando se hace grande el numero de grados 
de libertad. [Sugerencia: vea el renglon marcado oo en la Tabla 5, Apendice 3.] 

7.26 Consulte el Ejercicio 7.11. Suponga que, en el problema de fertilization del bosque, la desviacion 
estandar poblacional de areas basales no se conoce y debe estimarse a partir de la muestra. Si se ha de 
medir una muestra aleatoria de n — 9 areas basales, encuentre dos estadrsticos gj y g, tales que P[g\ < 
(Y ~ /x) < g 2 ] = .90. 

7.27 Ejercicio Applet Consulte el Ejemplo 7.7. Si tomamos muestras independientes de tamanos n 1 = 6y 
n 2 = 10 de dos poblaciones normales con varianzas poblacionales iguales, use la aplicacion F-Ratio 
Probabilities and Quantiles para hallar 

a P(Sf/Si> 2). 

b P{S\/Sl< 0.5). 

c la probabilidad de que una de las varianzas muestrales sea al menos el doble de grande que la otra. 

7.28 Ejercicio Applet Suponga que Y tiene una distribucion F con rq = 4 grados de libertad en el numerador 
y v 2 = 6 grados de libertad en el denominador. 

a Use la Tabla 7, Apendice 3, para hallar F 025 .Tambien determmelo con la aplicacion F-Ratio 
Probabilities and Quantiles. 

b Consulte el inciso a. iA que cuantil de Y corresponde F 02J ? ^A que percentil? 
c Consulte los incisos a y b. Use la aplicacion F-Ratio Probabilities and Quantiles para hallar F gls , el 
cuantil .025 (2.5o. percentil) de la distribution de Y. 
d Si U tiene una distribucion F con iq = 6 grados de libertad en el numerador y v 2 = 4 en el denomina¬ 
dor, use la Tabla 7, Apendice 3 o la aplicacion F-Ratio Probabilities and Quantiles para hallar F 025 . 
e En el Ejercicio 7.29, usted demostrara que si Y es una variable aleatoria que tiene una distribucion F 
con rq grados de libertad en el numerador y v 2 en el denominador, entonces U = 1/T tiene una distri¬ 
bucion F con v 2 grados de libertad en el numerador y iq en el denominador. ^,Este resultado explica la 
relation entre F gl5 del inciso c (4 grados de libertad en el numerador y 6 en el denominador) y F 025 
del inciso d (6 grados del libertad en el numerador y 4 en el denominador)? ^Cual es esta relation? 

7.29 Si Y es una variable aleatoria que tiene una distribucion F con rq grados de libertad en el numerador y 
v 2 grados de libertad en el denominador, demuestre que U = l/Y tiene una distribucion F con v 2 grados 
de libertad en el numerador y iq grados de libertad en el denominador. 

*7.30 Suponga que Z tiene una distribucion normal estandar y que Y es una variable aleatoria independiente 
con distribucion x 2 y con v grados de libertad. Entonces, segun la Definition 7.2, 



tiene una distribucion t con v grados de libertad. 1 

a Si Z tiene una distribucion normal estandar, de £(Z) y £(Z 2 ). [Sugerencia: para cualquier variable 
aleatoria, E(Z 2 ) = V(Z) + (£(Z)) 2 .] 


1. Los ejercicios precedidos por un asterisco son opcionales. 
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b De acuerdo con el resultado obtenido en el Ejercicio 4.112(a), si Y tiene una distribucion x 2 con 
v grados de libertad, entonces 


E{Y a ) 


r([y/2]+«) 

r (v/2) 


si v > -2a. 


Use este resultado, el resultado del inciso a y la estructura de T para demostrar lo siguiente. 
[Sugerencia: recuerde la independencia de Z y Y.] 


i E(T) = 0, si > 1. 


ii V{T) = v/(v -2), si v>2. 

7.31 a Use la Tabla 7, Apendice 3, para hallar F 01 para variables aleatorias con distribucion F, todas con 
4 grados de libertad en el numerador, pero con grados de libertad en el denominador de 10, 15, 30, 
60, 120 e oo. 

b Consulte el inciso a. ^Que observa acerca de los valores de F 01 conforme aumenta el ntimero de 
grados de libertad del denominador? 

c ^Cual es X.oi P ara una variable aleatoria con distribucion x~ y 4 grados de libertad? 

d Divida el valor de x.oi (4 grados de libertad) del inciso c entre el valor de F 01 (4 grados de libertad 
en el numerador; grados de libertad = oo en el denominador). Explique por que el valor que obtuvo 
es adecuado para la razon. [Sugerencia: considere la definicion de una variable aleatoria con distri¬ 
bucion F dada en la Definicion 7.3.] 


7.32 EjercicioApplet 

a Encuentre 1 05 para una variable aleatoria con distribucion t y 5 grados de libertad. 

b Consulte el inciso a. ^Cual es P(T 2 > f g 5 )? 

c Encuentre F 10 para una variable aleatoria con distribucion F con 1 grado de libertad en el numerador 
y 5 grados de libertad en el denominador. 

d Compare el valor de F 10 hallado en el inciso c con el valor de fg 5 de los incisos a y b. 

e En el Ejercicio 7.33 usted demostrara que si T tiene una distribucion t con v grados de libertad, 
entonces U = T 2 tiene una distribucion F con 1 grado de libertad en el numerador y v grados del li¬ 
bertad del denominador. gComo explica esto la relacion entre los valores de F 10 (1 grado de libertad 
1 en el numerador, 5 grados de libertad en el denominador) y t 2 0S (5 grados de libertad) que observo 
en el inciso d? 


7.33 Use las estructuras de T y F dadas en las Definiciones 7.2 y 7.3, respectivamente, para demostrar que si 
T tiene una distribucion t con v grados de libertad, entonces U = T 2 tiene una distribucion F con 1 grado 
de libertad en el numerador y v grados de libertad en el denominador. 

7.34 Suponga que W 1 y W 2 son variables aleatorias independientes y con distribucion x 2 con v \ y v 2 grados 
de libertad, respectivamente. De acuerdo con la Definicion 7.3, 


- _ Wi/vi 

r — --— 

tiene una distribucion F con jq y v 2 grados de libertad en numerador y denominador, respectivamente. 
Use la estructura anterior de F, la independencia de y W 2 y el resultado resumido en el Ejercicio 
7.30(b) para demostrar 

a £(F) = v 2 /{v 2 — 2), si v 2 > 2 . 

b V(F) = [2v 2 (v\ +v 2 - 2)]/[Mv 2 - 2) 2 {v 2 - 4)], si v 2 > 4. 

7.35 Consulte el Ejercicio 7.34. Suponga que F tiene una distribucion F con rq = 50 grados de libertad en el 
numerador y v 2 = 70 grados de libertad en el denominador. Observe que la Tabla 7, Apendice 3, no con- 
tiene entradas para 50 grados de libertad en el numerador y 70 grados de libertad en el denominador. 
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a ^Cual es E(F)7 
b Obtenga V(F). 

c ^Es probable que F sea mayor que 3? [Sugerencia: use el teorema de Tchebysheff.] 

*7.36 Sea S 2 la varianza muestral para una muestra aleatoria de diez valores ln(CL50) para cobre y sea S 2 
la varianza muestral para una muestra aleatoria de ocho valores ln(CL50) para plomo; se utilizaron 
muestras de la misma especie de peces. Se supone que la varianza poblacional para mediciones de cobre 
es el doble de la correspondiente varianza poblacional para mediciones de plomo. Suponga que Sj es 
independiente de S\. 

a Encuentre un numero b tal que 


b Encuentre un numero a tal que 



[, Sugerencia: use el resultado del Ejercicio 7.29 y observe que P(U 1 /U 2 — k) — P(U 2 /U 1 S 1 /£).] 
c Si a y b son los de los incisos a y b, encuentre 

4*14 

7.37 Sea Y v Y 2 , . . . , Y s una muestra aleatoria de tamano 5 de una poblacion normal con media 0 y varianza 
1 y sea Y = (1/5) Xa=i Sea Y 6 otra observation independiente de la misma poblacion. ^Cual es la 
distribucion de 

a W = YlUi y i 2 ? 6 Por que? 
b U =Ef=i(y. -E) 2 ?t,Porque? 

C Ef-i - y ) 2 + E 6 2 ? 7 P°r que? 

7.38 Suponga que Y \, Y 2 ,..., Y 5 , Y 6 , Y, W y U son como se define en el Ejercicio 7.37. ^Cual es la distri¬ 
bucion de 

a- V57 6 /VW? < Por que? 
b 2Y 6 /VU7 iPor que? 
c 2 ^5K 2 + Y g 2 ) /U7 iPor que? 

7.39 Suponga que muestras independientes (de tamano «/) se toman de cada una de k poblaciones y que la 

poblacion i esta normalmente distribuida con media /x, y varianza a 2 , i = 1,2 , ,k. Esto es, todas 

las poblaciones estan distribuidas normalmente con la misma varianza pero con (posiblemente) medias 
diferentes. Sean X t y S 2 , i— 1, 2,. . ., k las respectivas medias muestrales y varianzas. Sea 6 = c 1 /jl 1 + 
c 2 /jl 2 + ■ ■ ■ + c k /jL k , donde c,, c 2 ,. . . , c k son constantes dadas. 

a Calcule la distribucion de 0 = + c 2 X 2 + • • ■ +CkX k . Proporcione razones para cualesquiera 

afirmaciones que haga. 

b Proporcione la distribucion de 

SSE A , 

——, donde SSE = V (n,- — I) S 2 . 
a 2 ~ 

i=\ 

Justifique las afirmaciones que haga. 
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c Proporcione la distribucion de 


e - 

e 

/ / _2 _2 

2 \ 

](- + - + • 

• • + f T) MSE 

V V«1 «2 

n k ) 


donde MSE = 


SSE 

ni + n 2 + •••+«* — k 


Justifique las afirmaciones que haga. 


7.3 Teorema del Ifmite central 

En el Capftulo 5 demostramos que si Fj, Y 2 ,..., Y n representa una muestra aleatoria provenien- 
te de cualquier distribucion con media i± y varianza cr 2 , entonces E( Y) = /jl y V(Y) = a 2 jn. 
En esta seccion desarrollaremos una aproximacion para la distribucion muestral de Y, que se 
puede usar sin considerar la distribucion de la poblacion de la cual se tome la muestra. 

Si extraemos la muestra de una poblacion normal, el Teorema 7.1 nos dice que Y tiene 
una distribucion de muestreo normal. Pero, ( ',quc podemos decir acerca de la distribucion 
muestral de Y si las variables Y t no estan distribuidas normalmente? Por fortuna, Y tendra una 
distribucion muestral que es aproximadamente normal si el tamano de la muestra es grande. 
El enunciado formal de este resultado recibe el nombre de teorema del limite central. No 
obstante, antes de enunciar este teorema, veremos algunos estudios practicos que demuestran 
la distribucion muestral de Y. 

Se utilizo una computadora para generar muestras aleatorias de tamano n de una funcion 
con densidad exponencial y media 10, es decir, de una poblacion con densidad 

1(1/10 )e~ y ! w , y> 0, 

/(.v) = 

( 0, en cualquier otro punto. 

En la Figura 7.5 aparece una grafica de esta funcion de densidad. La media muestral se 
calculo para cada muestra y el histograma de frecuencia relativa para los valores de las me- 
dias muestrales para 1000 muestras, cada una de tamano n = 5, se presenta en la Figura 7.6. 
Observe que la Figura 7.6 presenta un histograma que tiene forma aproximada de campana, 
pero el histograma esta ligeramente sesgado. 

La Figura 7.7 es una grafica de un histograma similar de frecuencia relativa de los valores 
de la media muestral para 1000 muestras, cada una de tamano n = 25. En este caso, la Figura 
7.7 muestra un histograma casi simetrico en forma de campana, que se puede calcular en for¬ 
ma bastante cercana con una funcion de densidad normal. 

FIGURA 7.5 f(y) 

Funcion de densidad 
exponencial 








FIGURA 7.6 
Histograma de fre- 
cuencia relativa: 
medias muestrales 
para 1000 muestras 
(n = 5) tomadas de 
una distribucion ex- 
ponencial 


FIGURA 7.7 
Flistograma de fre- 
cuencia relativa: 
medias muestrales 
para 1000 muestras 
(n = 25) tomadas de 
una distribucion ex- 
ponencial 
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Frecuencia 

relativa 



Frecuencia 

relativa 



Recuerde del Capitulo 5 que E(Y) = /j, y = /-i y V(Y) = <Jj = a 2 /n. Para la funcion 
de densidad exponencial empleada en las simulaciones, /j. = E(Y-) = 10 y cr 2 = Vi YJ = 10 2 = 
100. Entonces, para este ejemplo, vemos que 

- , - a 2 100 

fly = E(Y) = n = 10 y a±=V(Y) = — = -. 

1 n n 

Para cada valor de n (5 y 25), calculamos el promedio de las 1000 medias muestrales gene- 
radas en el estudio. La varianza observada de las 1000 medias muestrales tambien se calculo 
para cada uno de los valores de n. Los resultados se muestran en la Tabla 7. 1. En cada estudio 
practico (n = 5 y n = 25), el promedio de las medias muestrales observadas y la varianza de 
las medias muestrales observadas son bastante cercanos a los valores teoricos. 

A continuacion enunciamos formalmente el teorema del limite central. 
















































372 


Capftulo 7 Distribuciones muestrales y el teorema del li'mite central 


TEOREMA 7.4 


EJEMPLO 7.8 


Solucion 


Tabla 7.1 Calculos para 1000 medias muestrales 


Tamano 

Promedio de 1000 

Varianza de 1000 


muestral 

medias muestrales /u,y = /x 

medias muestrales 

af = <r 2 /n 

n = 5 

9.86 10 

19.63 

20 

n = 25 

9.95 10 

3.93 

4 


Teorema del limite central: Sean K h Y 2 ,, Y n variables aleatorias independientes y 
distribuidas identicamente con E(Yj) = /jl y V{Y t ) = a 2 < oo. Definamos 


Un 



Y-H 

(T/\/n 


1 " 

donde Y = — V Y,. 
n 

1=1 


Entonces la funcion de distribucion de U n converge hacia la funcion de distribucion 
normal estandar cuando n —» oo. Esto es, 


11m P(U n < u) = I _ e 1 /2 dt para toda u. 

n ^°° J-oo \2tt 


El teorema del limite central implica que los enunciados de probabilidad acerca de U n pueden 
ser aproximados por probabilidades correspondientes para la variable aleatoria normal estan¬ 
dar si n es grande. (Por lo general, un valor de n mayor que 30 asegura que la distribucion de 
U n se puede calcular en forma aproximada por medio de una distribucion normal.) 

Por comodidad, la conclusion del teorema del limite central a menudo se sustituye con el 
enunciado mas sencillo de que Y esta distribuida normalmente en forma asintotica con media 
Ijl y varianza tr 2 /n. El teorema del limite central se puede aplicar a una muestra aleatoria K l? 
Y 2 ,, Y n para cualquier distribucion mientras E( Y ; ) = p. y V(Y^ = cr 2 sean finitas y el tarnano 
muestral sea grande. 

Daremos algunos ejemplos de la aplicacion del teorema del limite central pero aplazamos 
la demostracion hasta la siguiente seccion (cuyo estudio es opcional). La demostracion no es 
necesaria para entender las aplicaciones del teorema del limite central que aparece en este 
texto. 


Las calificaciones de examenes para todos los estudiantes de ultimo ano de preparatoria en 
cierto estado tienen media de 60 y varianza de 64. Una muestra aleatoria den = 100 estudian¬ 
tes de una escuela preparatoria grande tuvo una calificacion media de 58. ( ',Hay evidencia para 
sugerir que el nivel de conocimientos de esta escuela sea inferior? (Calcule la probabilidad de 
que la media muestral sea a lo sumo 58 cuando n = 100.) 

Denote con Y la media de una muestra aleatoria de n = 100 calificaciones de una poblacion 
con /jl = 60 y cr 2 = 64. Deseamos calcular P{Y < 58). Sabemos por el Teorema 7.4 que 
(Y — ji)/Ur/\fi) tiene una distribucion que puede aproximarse con una distribucion normal 
estandar. En consecuencia, usando la Tabla 4, Apendice 3, tenemos 


P(Y 


58) = P 


Y -60 

8/VI00 


58 -60\ 


* P(Z 


-2.5) = .0062. 
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Debido a que esta probabilidad es muy pequena, no es probable que la muestra de la escue- 
la estudiada se pueda considerar como muestra aleatoria de una poblacion con /j. = 60 y <r 2 = 
64. La evidencia sugiere que la calificacion promedio para esta preparatoria es menor que el 
promedio general de /z = 60. 

Este ejemplo ilustra el uso de probabilidad en el proceso de comprobacion de hipotesis, tec- 
nica comun de inferencia estadfstica que se estudiara con mas detalle en el Capftulo 10. ■ 


EJ EM P LO 7.9 Los tiempos de servicio para los clientes que pasan por la caja en una tienda de venta al me- 
nudeo son variables aleatorias independientes con media de 1.5 minutos y varianza de 1.0. 
Calcule la probabilidad de que 100 clientes puedan ser atendidos en menos de 2 horas de 
tiempo total de servicio. 

Solucion Si denotamos con Y j el tiempo de servicio para el t'-esimo cliente, entonces queremos calcu- 
lar 

- 120 \ - 

Y <- = P(Y < 1.20). 

100 / 

Como el tamano muestral es grande, el teorema del lfmite central nos dice que Y esta distri- 
buida normalmente en forma aproximada con media yu,y = n = 1.5 y varianza crA = a 2 /n = 
1.0/100. Por tanto, usando la Tabla 4, Apendice 3, tenemos 



P(Y 


/7- 1.50 < 1.20- 1.50 \ 

\ l/VToo ~~ l/VToo / 

« P[Z < (1.2 - 1.5)10] = P(Z < -3) = .0013. 


Entonces, la probabilidad de que 100 clientes puedan ser atendidos en menos de 2 horas 
es aproximadamente .0013. Esta pequena probabilidad indica que es practicamente imposible 
atender a 100 clientes en menos de 2 horas. ■ 


Ejercicios 

7.40 Ejercicio Applet Suponga que la poblacion de interes no tiene una distribucion normal. ^.Que aspecto 
presenta la distribucion muestral de Y y cual es el efecto del tamano de la muestra en la distribucion 
muestral de L? Use la aplicacion SampleSize para completar lo siguiente. Use las flechas de arriba/abajo 
a la izquierda del histograma de la distribucion poblacional para seleccionar la distribucion “Sesgada”. 
^Cual es la media y la desviacion estandar de la poblacion de la cual se seleccionaron las muestras? 
[Estos valores estan marcados My S, respectivamente, y se dan arriba del histograma poblacional.] 

a Use las flechas arriba/abajo en las cajas izquierda y derecha de “Sample Size” para seleccionar 
muestras de tamanos 1 y 3. Haga clic unas cuantas veces en el boton “1 Sample”. ^Que semejanzas 
hay entre los dos histogramas generados? ^Que es diferente en ellos? 
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b Haga clic unas cuantas veces en el boton “1000 Samples” y conteste las preguntas del inciso b. ^Los 
histogramas generados tienen las formas que esperaba? ^,Por que? 
c ^Las medias y desviaciones estandar de las dos distribuciones muestrales son cercanas a los valores 
que esperaba? [Sugerencia: T(T) = a 2 /n.\ 

d Haga clic en el boton “Toggle Normal”. ^Que observa acerca de lo adecuado de las distribuciones 
normales calculadas? 

e Haga clic en las dos distribuciones muestrales generadas para que aparezcan ventanas para cada 
una. Use las flechas arriba/abajo en las cajas izquierda y derecha de “Sample Size” para seleccionar 
muestras de tamano 10 y 25. Haga clic en el boton “Toggle Normal”. Ahora tiene ya las graficas de 
las distribuciones muestrales de las medias muestrales basadas en muestras de tamanos 1, 3, 10 y 25. 
^Que observa acerca de lo adecuado de la aproximacion normal cuando aumenta el tamano rnues- 
tral? 

7.41 Ejercicio Applet Consulte el Ejercicio 7.40. Use la aplicacion SampleSize para completar lo siguiente. 
Use la flecha arriba/abajo a la izquierda del histograma de la distribucion poblacional para seleccionar 
la distribucion “en forma de U”. ^Cual es la media y la desviacion estandar de la poblacion de la cual se 
seleccionaran las muestras? 

a Conteste las preguntas de los incisos (a-e) del Ejercicio 7.40. 

b Consulte el inciso a. Cuando examino la distribucion muestral de Y para n = 3, tenia un “valle” en 
el centra. ^Por que ocurrio esto? Use la aplicacion Basic para averiguarlo. Seleccione la distribucion 
poblacional “en forma de U” y haga clic en el boton “1 Sample.” ^Que observa acerca de los valores 
de observaciones individuales en la muestra? Haga clic en el boton “1 Sample” varias veces mas. 
^Los valores de la muestra tienden a ser (relativamente) grandes o pequenos con pocos valores en el 
“centra”? ^Por que? ^Que efecto tiene esto en el valor de la media muestral? [Sugerencia: 3 es un 
tamano muestral impar.] 

7.42 La resistencia a la ruptura del vidrio templado promedia 14 (medida en miles de libras por pulgada 
cuadrada) y tiene una desviacion estandar de 2. 

a ^Cual es la probabilidad de que el promedio de resistencia a la ruptura de 100 piezas seleccionadas 
aleatoriamente de este vidrio exceda de 14.5? 

b Encuentre un intervalo que incluya, con probabilidad 0.95, el promedio de resistencia a la ruptura de 
100 piezas de este vidrio seleccionadas aleatoriamente. 

7.43 Una antropologa desea calcular el promedio de estatura de los hombres de cierta raza. Si se supone que 
la desviacion estandar poblacional es de 2.5 pulgadas y si ella muestrea 100 hombres aleatoriamente, 
encuentre la probabilidad de que la diferencia entre la media muestral y la verdadera media poblacional 
no exceda de .5 pulgada. 

7.44 Suponga que la antropologa del Ejercicio 7.43 desea que la diferencia entre la media muestral y la media 
poblacional sea menor que .4 pulgada, con probabilidad de .95. ^Cuantos hombres debe tomar como 
muestra para lograr este objetivo? 

7.45 Trabajadores de una gran empresa de servicios tienen un salario promedio de $7.00 por hora con una 
desviacion estandar de $.50. La industria tiene 64 trabajadores de cierto grupo etnico que tienen un 
salario promedio de $6.90 por hora. ^Es razonable suponer que la tasa salarial del grupo etnico es equi- 
valente a la de una muestra aleatoria de trabajadores tomada de los empleados en la industria militar? 
[Sugerencia: calcule la probabilidad de obtener una media muestral menor o igual que $6.90 por hora.] 

La acidez de los suelos se mide mediante una cantidad llamada pH, que varfa de 0 (acidez alta) a 14 
(alcalinidad alta). Un edafologo desea calcular el promedio de pH para un campo de grandes dimensio- 
nes al seleccionar aleatoriamente n muestras de nucleos y medir el pH de cada muestra. Aun cuando la 


7.46 
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desviacion estandar poblacional de mediciones de pH no se conoce, la experiencia del pasado indica que 
casi todos los suelos tienen un valor de pH de entre 5 y 8. Si el cientffico selecciona n — 40 muestras, 
encuentre la probabilidad aproximada de que la media muestral de las 40 mediciones de pH este a .2 
unidades del verdadero promedio de pH para el campo. [Sugerencia: vea el Ejercicio 1.17.] 

7.47 Suponga que al cientffico del Ejercicio 7.46 le gustarfa que la media muestral estuviera a no mas de .1 
de la verdadera media con probabilidad .90. ^Cuantas muestras de nucleos debe tomar? 

7.48 Un aspecto importante de un plan economico federal era que los consumidores ahorraran una parte im- 
portante de dinero que recibieran por una reduccion de impuestos sobre sus ingresos. Suponga que las 
primeras estimaciones de la parte del total de impuesto ahorrada, con base en una muestra aleatoria de 
35 economistas, tuvo media de 26% y desviacion estandar de 12%. 

a ^Cual es la probabilidad aproximada de que la estimacion de la media muestral, basada en una mues¬ 
tra aleatoria de n = 35 economistas, se encuentre a no mas de 1% de la media de la poblacion de las 
estimaciones de todos los economistas? 

b ^Es necesariamente verdadero que la media de la poblacion de las estimaciones de todos los econo¬ 
mistas sea igual al porcentaje de ahorro en impuestos que en realidad se lograra? 

7.49 El tiempo necesario para el mantenimiento periodico de un automovil u otra maquina tiene por lo 
general una distribucion de probabilidad en forma de campana. Debido a que se presentaran algunos 
alargamientos en los tiempos de servicio, la distribucion tiende a estar sesgada a la derecha. Suponga 
que el tiempo necesario para dar servicio a un automovil que ha recorrido 5000 millas tiene una media 
de 1.4 horas y desviacion estandar de .7 horas. Suponga tambien que el departamento de servicio planea 
atender a 50 automoviles por jornada de 8 horas y que, para hacerlo, puede dedicar un tiempo promedio 
maximo de solo 1.6 horas por automovil. ^Cuantos dfas tendra que trabajar tiempo extra el departamento 
de servicio? 

7.50 Se ha encontrado que las mediciones de resistencia al corte en soldaduras por puntos tienen una des¬ 
viacion estandar de 10 libras por pulgada cuadrada (psi). Si se han de medir 100 soldaduras de prueba, 
^cual es la probabilidad aproximada de que la media muestral se encuentre a no mas de 1 psi de la ver¬ 
dadera media poblacional? 

7.51 Consulte el Ejercicio 7.50. Si la desviacion estandar de mediciones de resistencia al corte en soldaduras 
por puntos es 10 psi, ^cuantas soldaduras de prueba deben muestrearse si deseamos que la media mues¬ 
tral se encuentre a no mas de 1 psi de la verdadera media con probabilidad aproximada de .99? 

7.52 Los resistores que se han de usar en un circuito tienen un promedio de resistencia de 200 ohms y desvia¬ 
cion estandar de 10 ohms. Suponga que 25 de estos resistores se seleccionan aleatoriamente para usarse 
en un circuito. 

a ^Cual es la probabilidad de que la resistencia promedio para los 25 resistores este entre 199 y 202 
ohms? 

b Encuentre la probabilidad de que la resistencia total no exceda de 5100 ohms. [Sugerencia: vea el 
Ejemplo 7.9.] 

7.53 Concentraciones de monoxido de carbono de cierta hora en muestras de aire de una gran ciudad prome¬ 
dian 12 ppm (partes por millon) con desviacion estandar de 9 partes por millon. 

a ^Cree usted que las concentraciones de monoxido de carbono en las muestras de aire de esta ciudad 
estan distribuidas normalmente? (,Por que sf o por que no? 
b Encuentre la probabilidad de que la concentration promedio en 100 muestras seleccionadas aleato¬ 
riamente exceda de 14 partes por millon. 

7.54 Asfaltos no alterados, como se encuentran por lo general en depositos de plomo y zinc, tienen razones 
atomicas de hidrogeno/carbono (H/C) que promedian 1.4 con desviacion estandar de .05. Encuentre la 
probabilidad de que la razon promedio de H/C sea menor que 1.3 si seleccionamos al azar 25 muestras 
de asfaltos. 
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7.55 El tiempo de inactividad por dfa para una central de computo tiene una media de 4 horas y desviacion 
estandar de .8 hora. 

a Suponga que deseamos calcular probabilidades acerca del promedio diario de inactividad durante un 
periodo de 30 dfas. 

i i,Que suposiciones deben ser verdaderas para usar el resultado del Teorema 7.4 y asf obtener una 
aproximacion valida para probabilidades acerca del promedio diario de inactividad? 

ii De acuerdo con las suposiciones descritas en el inciso i, ^cual es la probabilidad aproximada de 
que el promedio diario de inactividad, durante un periodo de 30 dfas, sea de entre 1 y 5 horas? 

b De acuerdo con las suposiciones descritas en el inciso a, ^cual es la probabilidad aproximada de que 
el tiempo total de inactividad, durante un periodo de 30 dfas, sea menor que 115 horas? 

7.56 Para muchos productos a granel, por ejemplo mineral de hierro y azucar sin refinar, se muestrea su 
calidad mediante un metodo que requiere que pequenas muestras se tomen periodicamente cuando el 
material se mueve en una banda transportadora. Las pequenas muestras se combinan entonces y se 
mezclan para formar una muestra compuesta. Denote con Y t el volumen de la i-esima pequena muestra 
de un lote particular y suponga que Pj, Y 2 , . . . , Y n constituyen una muestra aleatoria y que cada valor 
de Y i tiene una media de /x (en pulgadas cubicas) y varianza cr 2 . El volumen promedio /x de las muestras 
se puede establecer al ajustar el tamano del equipo de muestreo. Suponga que se sabe que la varianza 
a 2 de los volumenes de las muestras es aproximadamente 4. El volumen total de la muestra compuesta 
debe exceder de 200 pulgadas cubicas con probabilidad aproximadamente de .95 cuando se seleccionan 
n = 50 pequenas muestras. Determine un ajuste para /x que permita que se satisfagan los requisitos del 
muestreo. 

7.57 Se conectan 25 lamparas de calor en un invernadero para que cuando falle una de ellas, otra tome su 
lugar de inmediato. (Solo una lampara se enciende a la vez.) Las lamparas operan de manera indepen- 
diente y cada una tiene una vida util de 50 horas y desviacion estandar de 4 horas. Si el invernadero no 
se revisa durante 1300 horas despues de encender el sistema de lamparas, ^cual es la probabilidad de que 
una lampara permanezca encendida al final del periodo de 1300 horas? 

7.58 Suponga que X v X,,. . ., X n y que Y v Y 2 ,..., Y n son muestras aleatorias independientes de poblaciones 
con medias /jl 1 y /x 2 y varianzas crf y of, respectivamente. Demuestre que la variable aleatoria 

n = (X-Y)-Un ~/x 2 ) 

\J (cr 2 + of) In 

satisface las condiciones del Teorema 7.4 y por tanto que la funcion de distribucion U n converge hacia 
una funcion de distribucion normal estandar cuando n —> oo. [Sugerencia: considere = X - Y t , para i = 
1 , 2 ,...,«.] 

7.59 Se disena un experimento para determinar si el operador A o el operador B obtienen el trabajo de operar 
una nueva maquina. Se toma el tiempo a cada operador en 50 intentos independientes que comprenden 
la realizacion de cierto trabajo usando la maquina. Si las medias muestrales para los 50 intentos difieren 
en mas de 1 segundo, el operador con el menor tiempo medio obtiene el trabajo. De otro modo, el ex¬ 
perimento es considerado como terminado en empate. Si las desviaciones estandar de los tiempos para 
ambos operadores se suponen de 2 segundos, ^.cual es la probabilidad de que el operador A obtenga el 
trabajo aun cuando ambos operadores tengan igual capacidad? 

7.60 El resultado del Ejercicio 7.58 se cumple incluso si difieren los tamanos muestrales. Esto es, si Aj, 
X,,. . ., X y Y v Y 2 , ..., Y constituyen muestras aleatorias independientes de poblaciones con medias 
Mi y TL y varianzas cr 2 y of, respectivamente, entonces X — Y estara distribuida normalmente en forma 
aproximada, para n l y n 2 grandes, con media /jl 1 - /jl 2 y varianza (cr 2 /n i ) + (of /n 2 ). 

La filtracion de agua por el suelo depende, entre otras cosas, de la porosidad (proporcion de huecos 
por volumen) del suelo. Para comparer dos tipos de suelo arenoso, se han de tomar n l — 50 mediciones 
de la porosidad del suelo A y n 2 = 100 mediciones del suelo B. 
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Suponga que of = .01 y of = .02. Encuentre la probabilidad de que la diferencia entre las medias 
muestrales este a no mas de .05 unidades de la diferencia entre las medias poblacionales fjL 1 - /jl 2 . 

7.61 Consulte el Ejercicio 7.60. Suponga que n l = n 2 = n, y encuentre el valor de n que permita que la dife¬ 
rencia entre las medias muestrales sea no mayor que .04 unidades de /jl 1 - n-, con probabilidad .90. 

7.62 Los tiempos que una cajera emplea para procesar el pedido de un cliente son variables aleatorias in- 
dependientes, con media de 2.5 minutos y desviacion estandar de 2 minutos. ^Cual es la probabilidad 
aproximada de que tome mas de 4 horas procesar los pedidos de 100 personas? 

7.63 Consulte el Ejercicio 7.62. Encuentre el numero de clientes n tal que sea aproximadamente .1 la proba¬ 
bilidad de que los pedidos de los n clientes se puedan procesar en menos de 2 horas. 


7.4 Una demostracion del teorema 
del Ifmite central (opcional) 

Esbozaremos una demostracion del teorema del limite central para el caso en el que existan 
las funciones generadoras de momento para las variables aleatorias de la muestra. La demos¬ 
tracion depende de un resultado fundamental de la teorfa de probabilidades que no se puede 
demostrar aqur pero que se expresa en el Teorema 7.5. 

TEOREMA 7.5 Sean Yy Y u Y 2 , F 3 ... variables aleatorias con funciones generadoras de momento m(t) y 
m^t), m 2 (t), m 3 (t ),. . ., respectivamente. Si 

lrm m n (t ) = m(t) para toda t real, 

n —>oo 

entonces la funcion de distribucion de Y n converge hacia la funcion de distribucion de Y 
cuando n —> oo. 


A continuacion damos la demostracion del teorema del limite central, Teorema 7.4. 


Demostracion 


Sea 


U„ =Vn 




= _L Yi 11/1 \ = J_ U z 

V” V o- / Vn 


donde Z, = 


Yi-n 


Debido a que las Y, de las variables aleatorias son independientes e identicamente distri- 
buidas, Z ; , i = 1,2son independientes e identicamente distribuidas con E(Z : ) = 0 y 
V(Z,) =1. 

Como la funcion generadora de momento de la suma de variables aleatorias indepen¬ 
dientes es el producto de las funciones generadoras de momentos de cada una. 


X m Z 2 (r)X • • • Xm Zi (t) = [m Zl (f)]" 
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'»Zi 


(v« 


Por el teorema de Taylor, con residuo (vea su texto de Calculo) 

+2 


m Zl (t ) = m Zl (0) + m' Zl (0)f +ot Z i (^) —, 


donde 0 < £ < t. 


y como m Zl (0) = E(e 0Zl ) = E{ 1) = l,y m' Z| (0) = E(Z{) = 0, 


m Zl (t) = 1 + 


2 



donde, 0 < £ < t. 


Por tanto 


m Un (t) = 


/ f \ 

2 \V«/ 


donde 0 < . 

V« 


Observe que conforme —» oo, —> 0 y m Z| (£«)f 2 /2 —> m Zi (0)f 2 /2 = E(Z\)t 2 

/2 = f 2 /2 porque E(Zf) = V(Zi) = 1. Recuerde que si 


lim = b 

n—> oo 


entonces. 


lim f 1 + ^ 


n 



Finalmente, 

j + ?W Z| _ ^,2/2 

n 

es la funcion generadora de momento para una variable aleatoria normal estandar. Con 
la aplicacion del Teorema 7.5 concluimos que U n tiene una funcion de distribucion que 
converge hacia la funcion de distribucion de la variable aleatoria normal estandar. 


lim m Un (t) = lim 

n —> oo " n —> oo 


7.5 Aproximacion normal a la 
distribucion binomial 

El teorema del limite central tambien se puede usar para aproximar probabilidades de algunas 
variables aleatorias discretas cuando las probabilidades exactas sean dificiles de calcular. Un 
ejemplo util comprende la distribucion binomial para valores grandes del numero de intentos n. 

Suponga que Y tiene una distribucion binomial con n intentos y probabilidad de exito en 
cualquier intento denotado por p. Si deseamos hallar P( Y < b ), podemos usar la funcion de 
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probabilidad binomial para calcular P(Y = y) para cada entero no negativo y menor o igual 
a b y luego sumar estas probabilidades. Se puede disponer de tablas para algunos valores del 
tamano muestral n, pero el calculo directo es engorroso para valores grandes de n para los que 
no hay tablas. 

De manera alternativa, podemos ver a Y, el numero de exitos en n intentos, como una suma 
de una muestra formada de ceros y unos; esto es, 

n 

i = l 

donde 

( 1, si el i-esimo intento resulta en exito, 

x t = 

l 0, en otro caso. 

Las variables aleatorias X l para i = 1,2 , ,n son independientes (porque los intentos son 

independientes) y es facil demostrar que E(X/) = p y V (X ; ) = p( 1 — p) para i = 1,2 

En consecuencia, cuando n es grande, la fraccion muestral de exitos, 

Y 1 ^ - 

- = -YXi=x, 

n n 

1 = 1 

posee una distribucion muestral aproximadamente normal con media E(X/) = p y varianza 
V(X/)/n = p{ 1 -p)/n. 

Entonces, hemos empleado el Teorema 7.4 (el teorema del limite central) para establecer 
que si Y es una variable aleatoria binomial con parametros n y p y si n es grande, entonces Y/n 
tiene aproximadamente la misma distribucion que U, donde U esta distribuida normalmente 
con media ji,, = p y varianza cr ^ = p{\ — p)/n. De la misma manera, para n grande, po¬ 
demos considerar que Y tiene aproximadamente la misma distribucion que W, donde W esta 
distribuida normalmente con media p w = np y varianza <t^ v = np( 1 — p). 

EJEMPLO 7.10 

La candidata A piensa que puede ganar las elecciones en una ciudad si obtiene por lo menos 
55% de los votos en el distrito electoral 1. Tambien piensa que alrededor de 50% de los votan- 
tes de la ciudad estan a su favor. Si n = 100 votantes se presentan a votar en el distrito electoral 
1, ( 'Cual es la probabilidad de que la candidata A reciba al menos 55% de sus votos? 

Solucion 

Sea Y el numero de votantes del distrito electoral 1 que estan a favor de la candidata A. 
Debemos calcular P(Y/n > .55) cuando p es la probabilidad de que un votante seleccionado 
aleatoriamente del distrito electoral 1 este a favor de la candidata A. Si consideramos los n = 
100 votantes del distrito electoral 1 como una muestra aleatoria de la ciudad, entonces Y tiene 
una distribucion binomial con n = 100 y p = .5. Hemos visto que la fraccion de votantes que 
estan a favor de la candidata A es 

V 1 " 

-■iVi, 

n n 

i=i 


donde X l = 1 si el i-esimo votante esta a favor de la candidata A y X t = 0 de otro modo. 

Como es razonable suponer que X t = 1,2,... ,n son independientes, el teorema del limite 
central implica que X = Y/n esta distribuida normalmente en forma aproximada con media 
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p = .5 y varianza pq/n = (.5)(.5)/100 = .0025. Por tanto, 


P - > .55 = P 


Y/n - .5 
Vd)025 


.55 - .50 \ 
.05 ) 


« P(Z 


1) = .1587 


de la Tabla 4, Apendice 3. 


La aproximacion normal a las probabilidades binomiales funciona bien para las n rela- 
tivamente grandes mientras p no sea cercana a cero o uno. Una regia practica util es que la 
aproximacion normal a la distribucion binomial es apropiada cuando p ± 3\/pq/n esta en el 
intervalo (0, 1), es decir, si 


0 < p — 3y/pq/n y p + 3y 7 pq/n < 1. 

En el Ejercicio 7.70 usted demostrara que un criterio mas conveniente pero similar es que 
la aproximacion normal es adecuada si 

/el mayor de p y q\ 

n > 91-1 . 

\el menor de p y qj 

Como veremos en el Ejercicio 7.71, para algunos valores de p, en ocasiones se satisface este 
criterio para valores moderados de n. En especial para valores moderados de n se puede ob- 
tener una mejorfa considerable en la aproximacion mediante un ligero ajuste en las fronteras 
empleadas en los calculos. Si vemos el segmento de una distribucion binomial graficado en la 
Figura 7.8, podemos ver lo que ocurre cuando tratamos de calcular una distribucion discreta 
representada por un histograma con una funcion de densidad continua. 

Si deseamos determinar P(Y < 3) con el uso de la distribucion binomial, podemos calcular 
el area total de los cuatro rectangulos (arriba de 0, 1, 2 y 3) ilustrados en el histograma bino¬ 
mial (Figura 7.8). Observe que el area total de los rectangulos puede ser aproximada por me¬ 
dio del area bajo la curva normal, la cual incluye algunas areas que no estan en el histograma 
y excluye la parte del histograma que se encuentre arriba de ella. Si deseamos determinar P(Y 
< 3) al calcular un area bajo la funcion de densidad, el area bajo la funcion de densidad loca- 
lizada a la izquierda de 3.5 da una mejor aproximacion que el area localizada a la izquierda de 
3.0. El siguiente ejemplo ilustra que tan cerca esta la aproximacion normal para un caso en el 
que pueden hallarse algunas probabilidades binomiales exactas. 


FIGURA 7.8 
Aproximacion nor¬ 
mal a la distribucion 
binomial: n = 10 
yp = .5 
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EJEMPLO 7.11 Suponga que Y tiene una distribucion binominal con n = 25 y p = .4. Encuentre las proba- 
bilidades exactas de que T<8yF=8y compare estas con los valores correspondientes 
determinados con el uso de la aproximacion normal. 

Solucion De la Tabla 1, Apendice 3, hallamos que 

P(Y< 8) = .274 


y 


P(Y = 8) = P(Y < 8) - P(Y <7) = .274 - .154 = .120. 


Como dijimos antes, podemos considerar que Y tiene aproximadamente la misma distribu¬ 
cion que W, donde W esta distribuida normalmente con p w = np y = np( I — p). Como 
buscamos P(Y < 8), vemos el area de la curva normal localizada a la izquierda de 8.5. Asi, 


P(Y <8) « P(W <8.5) = P 


W — np 
_Vnp( 1 ~ p) 


= P(Z < -.61) = .2709 


8.5 - 10 ' 
V25(.4)(.6)_ 


de la Tabla 4, Apendice 3. Este valor aproximado es cercano al valor exacto para P(Y < 8) = 
.274, obtenido de las tablas binomiales. 

Para determinar la aproximacion normal a la probabilidad binomial p( 8), calcularemos el 
area bajo la curva normal entre los puntos 7.5 y 8.5 porque este es el intervalo incluido en la 
barra del histograma localizada sobre v = 8 (vease la Figura 7.9). 

Como Y tiene aproximadamente la misma distribucion que W, donde W esta distribuida 
normalmente con p w = np = 25(.4) = 10 y cr^ = np( 1 — p) = 25(.4)(.6) = 6, se deduce 
que 

P(Y = 8) « P(7.5 < W < 8.5) 

_ /7.5 - 10 < VK - 10 < 8.5 - 10\ 

l V6 V6 V6 ) 

= P(- 1.02 < Z < -.61) = .2709 - .1539 = .1170. 


FIGURA 7.9 
P(Y = 8) para la 
distribucion binomial 
del Ejemplo 7.11 
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Nuevamente vemos que este valor aproximado es muy cercano al valor real, P(Y = 8) = 
.120, calculado antes. ■ 


Lrneas antes, en el ejemplo, empleamos el area bajo una curva normal para calcular P(Y 
< 8) y P(Y = 8) cuando Y tenia una distribucion binomial con n = 25 y p = .4. Para mejorar 
la aproximacion, .5 se sumo al valor maximo de interes (8) cuando usamos la aproxima¬ 
cion P( Y < 8) ~ P(W < 8.5) y W tenia una distribucion normal apropiada. De haber estado 
interesados en calcular P(Y > 6), hubieramos usado P(Y > 6) = P(W > 5.5); esto es, habria- 
mos restado .5 del valor mas pequeno de interes (6). El .5 que sumamos al valor maximo de 
interes (haciendolo un poco mayor) y sustraemos del valor rninimo de interes (haciendolo un 
poco menor), suele recibir el nombre de correction de continuidad asociada con la aproxi¬ 
macion normal. La unica vez que se usa esta correccion de continuidad en el texto es cuando 
calculamos una distribucion binomial (discreta) con una distribucion normal (continua). 


Ejercicios 

7.64 Ejercicio Applet entre en la aplicacion Normal Approximation to Binomial Distribution (en www.thom- 

sonedu.com/statistics/wackerly). Cuando se inicia la aplicacion, esta exhibe los detalles del Ejemplo 
7.11 y la Figura 7.9. Al principio, la pantalla contiene solo el histograma binomial y el valor exacto 
(calculado usando la funcion de probabilidad binomial) para p(8) = P(Y = 8). Arrastre hacia abajo 
un poco y haga clic en el boton “Toggle Normal Approximation" para recubrir la densidad normal con 
media 10 y desviacion estandar Vd5 = 2.449, las mismas media y desviacion estandar que la variable 
aleatoria binomial Y. Obtendra una grafica superior a la de la Figura 7.9. 

a ^Cuantas funciones de probabilidad de masa o densidad se exhiben? 

b Introduzca 0 en la caja marcada “Begin” y presione la tecla de Aceptar. ^Que probabilidades obtie- 
ne? 

c Consulte el inciso b. En la lfnea donde se exhibe la probabilidad normal de aproximacion, vera la 
expresion 


Normal: P(-0.5 < = k < = 8.5) = 0.2701. 


^Por que estan los .5 en esta expresion? 

7.65 Ejercicio Applet Suponga que Y dene una distribucion binomial con n = 5 y p = .10. 

a Use la aplicacion Normal Approximation to Binomial Distribution para hallar valores exactos y 
aproximados de P(Y £ 1). 

b La aproximacion normal no es particularmente buena. r,Por que? 

7.66 Ejercicio Applet Consulte el Ejercicio 7.65. En ese caso, p(Y < 1) = P(\Y — E(Y)\ < 1). Sip = 
.10, use la aplicacion Normal Approximation to Binomial Distribution para determinar la n mas pequena 
para que el valor exacto y la aproximacion normal de P(\Y- E{Y)\ < 1) difieran en menos de .01. 
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Ejercicio Applet Suponga que Y tiene una distribucion binomial con p = .20. 

a Use la aplicacion Normal Approximation to Binomial Distribution para hallar valores exactos y 
aproximados de P(Y £ p + 3) para n = 5, 10, 15 y 20. Para cada tamano muestral, ponga atencion a 
las formas de los histogramas binomiales y lo cercanas que estan las aproximaciones a las probabili- 
dades binomiales exactas. 

b Consulte el inciso a. ^Que observo acerca de las formas de los histogramas binomiales cuando au- 
mento el tamano muestral? i,Que observo acerca de las diferencias entre los valores exactos y aproxi¬ 
mados para P(Y £ p + 3) a medida que aumento el tamano muestral? 
c De acuerdo con la regia practica para lo adecuado de la aproximacion normal, ^que tan grande debe 
ser n para que la aproximacion sea adecuada? ^Es esto consistente con lo que observo en los incisos 
a y b? 

Ejercicio Applet En 2004 el estado de Florida resulto afectado por cuatro huracanes de gran intensidad. 
En 2005 un estudio indico que en 2004, 48% de las familias en Florida no tenfan planes para escapar de 
un huracan que se aproximaba. Suponga que una muestra aleatoria reciente de 50 familias se selecciono 
en Gainesville y que los miembros de 29 de las familias indicaron que tenfan un plan de escape en caso 
de huracan. 

a Si los porcentajes estatales de 2004 todavfa fueran validos para las familias recientes de Gainesville, 
use la aplicacion Normal Approximation to Binomial Distribution para determinar los valores exacto 
y aproximado de la probabilidad que 29 o mas de las familias muestreadas tengan un plan de escape 
para el huracan. 

b Consulte el inciso a. ^La aproximacion normal es cercana a la probabilidad binomial exacta? Explique 
por que. 

Consulte el Ejercicio 7.68. 

a Con base en su respuesta al Ejercicio 7.68(a), ^piensa usted que los porcentajes de 2004 de Florida 
todavfa se aplican a las nuevas familias de Gainesville? 
b Sea Y el numero de familias de Gainesville que tienen un plan de escape en caso de huracan en 
una muestra de tamano 50. Use la aplicacion Normal Approximation to Binomial Distribution para 
determinar el valor de b, de modo que P(Y & b ) sea lo suficientemente pequena como para llegar 
a la conclusion de que los porcentajes de Florida de 2004 no se aplican a las nuevas familias de 
Gainesville. 

En esta seccion enunciamos la regia practica de que la aproximacion normal a la distribucion binomial 
es adecuada si p ± 3V pq /« se encuentra en el intervalo (0, 1), es decir, si 


0 < p — 'hsjpqjn y p +3^pq/n < 1. 


a Demuestre que 


p + 3 y/pq/n < 1 si y solo si n > 9(p/q). 


b Demuestre que 


0 < p — 3 yfpqjn si y solo si n > 9 (q/p). 


c Combine los resultados de los incisos a y b para obtener que la aproximacion normal a la binomial es 
adecuada si 


7.67 


7.68 


7.69 


7.70 



o bien, de manera equivalente. 
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7.71 Consulte el Ejercicio 7.70. 

a ^Para que valores de n sera adecuada la aproximacion normal a la distribucion binomial si p = .5? 
b Conteste la pregunta del inciso a sip = .6, .4, .8, .2, .99 y .001. 

7.72 Una maquina se apaga para repararla si una muestra aleatoria de 100 piezas seleccionadas de la produc¬ 
tion diaria de la maquina contiene al menos 15% de piezas defectuosas. (Suponga que la production 
diaria es un numero grande de piezas.) Si en un dfa determinado la maquina esta produciendo solo 10% 
de piezas defectuosas, ),cual es la probabilidad de que sea apagada? [Sugerencia: use la correction de 
continuidad .5.] 

7.73 Una lrnea aerea encuentra que 5% de las personas que hacen reservaciones para cierto vuelo no se pre- 
sentan para el mismo. Si la lrnea aerea vende 160 boletos para un vuelo con solo 155 asientos, ^cual es 
la probabilidad de que se disponga de un asiento para cada persona que tiene una reservation y piense 
volar? 

7.74 De acuerdo con una encuesta realizada por la American Bar Association, 1 de cada 410 estadounidenses 
es abogado. mientras que 1 de cada 64 residentes en Washington, D.C. es abogado. 

a Si se seleccionan aleatoriamente 1500 estadounidenses, ),cual es la probabilidad aproximada de que 
la muestra contenga al menos un abogado? 

b Si la muestra se selecciona entre los residentes de Washington, D.C., ),cual es la probabilidad aproxi¬ 
mada de que la muestra contenga mas de 30 abogados? 
c Si nos encontramos en una esquina en las calles de Washington, D.C. y entrevistamos a las primeras 
1000 personas que pasan y 30 dicen que son abogados, ),esto sugiere que la densidad de abogados 
que pasan por la esquina es mayor que la densidad dentro de la ciudad? Explique. 

7.75 Un entrevistador piensa que 20% de los votantes de cierta zona estan a favor de la emision de bonos. 
Si 64 votantes se muestrean aleatoriamente de entre el gran numero de electores de esta zona, calcule 
la probabilidad de que la fraction muestreada de votantes que estan a favor de la emision de bonos no 
difiera en mas de .06 de la fraction real. 

7.76 a Demuestre que la varianza de Y/n, donde Y tiene una distribucion binomial con n intentos y una 

probabilidad de exito de p, tiene un maximo en p = .5 para n fija. 
b Se ha de seleccionar una muestra aleatoria de n piezas de un lote grande, observando el numero Y 
de piezas defectuosas. ^Que valor de n garantiza que Y/n estara a no mas de .1 de la fraction real de 
piezas defectuosas, con probabilidad de .95? 

7.77 El gerente de un supermercado desea obtener information acerca de la proportion de clientes a quienes 
les disgusta la nueva polftica de hacer efectivos los cheques. ),Cuantos clientes debe seleccionar si desea 
que la fraction muestral se encuentre a no mas de .15 de la fraction real, con probabilidad de .98? 

7.78 Si el gerente del supermercado (Ejercicio 7.77) muestrea n = 50 clientes y si la fraction real de clientes 
a quienes les disgusta la polftica es aproximadamente .9, encuentre la probabilidad de que la fraction 
muestral se encuentre a no mas de .15 unidades de la fraction real. 

7.79 Suponga que una muestra aleatoria de 25 piezas se selecciona de la maquina del Ejercicio 7.72. Si la 
maquina produce 10% de piezas defectuosas, encuentre la probabilidad de que la muestra contenga al 
menos dos piezas defectuosas, usando los siguientes metodos: 

a La aproximacion normal a la binomial, 
b Las tablas binomiales exactas. 

7.80 La edad promedio de los residentes de Estados Unidos es 31 anos. Si se entrevista a 100 residentes se- 
leccionados aleatoriamente, ),cual es la probabilidad aproximada de que al menos 60 tengan menos de 
31 anos de edad? 
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7.81 Un plan de muestreo de aceptacion de un lote especifica que 50 piezas sean seleccionadas aleatoriamen- 
te y que el lote sea aceptado si no mas de 5 de las piezas elegidas no se ajustan a las especificaciones. 

a ^Cual es la probabilidad aproximada de que un lote sea aceptado si la verdadera proporcion de piezas 
que no se ajustan a especificaciones en el lote es .10? 

b Conteste la pregunta del inciso a si la verdadera proporcion de piezas que no se ajustan a especifica¬ 
ciones en el lote es .20 y .30. 

7.82 La calidad de discos de computadora se mide por el numero de pulsos faltantes. La marca X es tal que 
80% de los discos no tienen pulsos faltantes. Si se inspeccionan 100 discos de la marca X, ^,cual es la 
probabilidad de que 15 o mas contengan pulsos faltantes? 

7.83 Ejercicio Applet Los vehiculos que entran a un crucero desde el este tienen igual probabilidad de dar 
vuelta a la izquierda, a la derecha o continuar de frente. Si 50 vehiculos entran a este crucero desde el 
este, use la aplicacion Normal Approximation to Binomial Distribution para determinar las probabilida- 
des exactas y aproximadas de que 

a 15 o menos den vuelta a la derecha. 

b A1 menos dos tercios de la muestra den vuelta. 


7.84 As! como la diferencia entre dos medias muestrales esta distribuida normalmente para muestras grandes, 
la diferencia entre dos proporciones muestrales esta distribuida de la misma manera. Es decir, si Y 1 y Y 2 
son variables aleatorias binomiales independientes con parametros (n v p j) y (« 2 , p 2 ), respectivamente, 
entonces (Y l /n l ) - ( Y 2 /n 2 ) esta distribuida normalmente en forma aproximada para grandes valores de 

>h y n 2- 


7.85 


a 

b 


Encuentre E 
Encuentre V 



Para verificar la abundancia relativa de cierta especie de peces en dos lagos, se toman n = 50 observa- 
ciones relacionadas con los resultados de la captura en cada uno de los lagos. Para cada observacion, 
el experimentador solo registra si la especie deseada estaba presente en la trampa. La experiencia del 
pasado ha demostrado que esta especie aparece en trampas del lago A aproximadamente 10% del tiempo 
y en trampas del lago B, alrededor de 20% del tiempo. Use estos resultados para aproximar la probabili¬ 
dad de que la diferencia entre las proporciones muestrales sea de no mas de . 1 de la diferencia entre las 
proporciones reales. 


7.86 Un auditor muestrea 100 de los comprobantes de viaje de una empresa para averiguar que porcentaje de 
entre el conjunto total de comprobantes esta mal documentado. ^Cual es la probabilidad aproximada 
de que mas de 30% de los comprobantes muestreados esten mal documentados si, de hecho, solo 20% de 
todos los comprobantes estan mal documentados? Si usted fuera el auditor y observa que mas de 30% 
esta mal documentado, £que concluirfa acerca de lo dicho por la empresa de que solo 20% sufria de mala 
documentacion? ^,Por que? 


7.87 Los tiempos para procesar pedidos en el mostrador de servicio de una farmacia estan distribuidos expo- 
nencialmente con media de 10 minutos. Si 100 clientes pasan al mostrador en un periodo de 2 dfas, ^,cual 
es la probabilidad de que al menos la mitad de ellos necesite esperar mas de 10 minutos? 


7.6 Resumen 

Para hacer inferencias acerca de parametros poblacionales, necesitamos conocer las distribu- 
ciones de probabilidad para ciertos estadisticos , funciones de las variables aleatorias obser¬ 
vables de la muestra (o muestras). Estas distribuciones de probabilidad dan modelos para el 
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Tabla 7.2 Procedimientos R (y S-Plus) que dan probabilidades y percentiles para distribuciones normales, 
X 2 r t y F 


Distribucion 

P(Y =£yo) 

p-e simo cuantil 

<t>,, tal que P(Y < f p ) = p 

Normal (/r,cr) 

pnorm (y 0 , p, a) 

qnorm(p, p, a) 

X 2 con v grados de libertad 

pchisq (yo, v) 

qchisq(p,v) 

t con v grados de libertad 

pt (yo, v ) 

qt(p,v) 

F con vi gl en el numerador, 
v 2 gl en el denominador 

pf (y 0 , vi,v 2 ) 

qf (p, Vi, v 2 ) 


comportamiento de frecuencia relativa de los estadfsticos en muestreo repetido; en consecuen- 
cia, se conocen como distribuciones muestrales. Hemos visto que las distribuciones normales, 
X 2 , t y F dan modelos para las distribuciones de muestreo de estadfsticos empleados para 
hacer inferencias acerca de los parametros asociados con distribuciones normales. Para mayor 
comodidad, la Tabla 7.2 contiene un resumen de los comandos R (o S-Plus) que proporcionan 
probabilidades y cuantiles asociados con estas distribuciones. 

Cuando el tamano muestral es grande, la media muestral Y posee una distribucion aproxi- 
madamente normal si la muestra aleatoria se toma de cualquier distribucion con media finita 
/i y una varianza finita a 2 . Este resultado, conocido como el teorema del limite central, tam- 
bien proporciona la justification para calcular probabilidades binomiales con probabilidades 
correspondientes asociadas con la distribucion normal. 

Las distribuciones muestrales expuestas en este capftulo se usaran en los procedimientos 
para hacer inferencias que se presentan en capftulos subsecuentes. 
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Ejercicios complementarios 

7.88 La eficiencia (en lumenes por watt) de los focos de cierto tipo tiene una media poblacional de 9.5 y 
desviacion estandar de .5, de acuerdo con especificaciones de production. Las especificaciones para un 
cuarto en el que ocho de estos focos se han de instalar exigen que el promedio de eficiencia de los mis- 
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7.89 

7.90 

7.91 


7.92 

7.93 

7.94 

7.95 


mos sea mayor que 10. Encuentre la probabilidad de que se satisfaga esta especificacion para el cuarto, 
suponiendo que las mediciones de eficiencia estan distribuidas normalmente. 

Consulte el Ejercicio 7.88. ^Cual debe ser la eficiencia media por foco si debe satisfacerse la especifi¬ 
cacion para el cuarto con una probabilidad de aproximadamente .80? (Suponga que la varianza de las 
mediciones de eficiencia continua en .5.) 

Briggs y King desarrollaron la tecnica de trasplante nuclear, en el que el nucleo de una celula de una de 
las etapas finales de desarrollo de un embrion se trasplanta en un cigoto (un huevo fertilizado de una sola 
celula), para ver si el nucleo puede soportar un desarrollo normal. Si .65 es la probabilidad de que un 
solo trasplante de la etapa temprana de gastrula sea exitosa, ^cual es la probabilidad de que mas de 70 
trasplantes de entre 100 sea exitosa? 

Un distribuidor minorista vende tres marcas de automoviles. Para la marca A, su utilidad X por venta, 
esta distribuida normalmente con parametros (/ii, cr/); para la marca B su utilidad Y por venta esta dis- 
tribuida normalmente con parametros (/xt, <x|); para la marca C, su utilidad W por venta esta distribuida 
normalmente con parametros (/x3, cr 2 ). Para un ano, dos quintas partes de las ventas del distribuidor 
son de la marca A, un quinto de la marca B y los dos quintos restantes de la marca C. Si contamos con 
datos sobre las utilidades por ventas rq, n, y n 3 de las marcas A, B y C, respectivamente, la cantidad 
U = AX + .2 Y + AW calculara el verdadero promedio de utilidad por ventas para el ano. Encuentre 
la media, la varianza y la funcion de densidad de probabilidad para U. Suponga que X, Y y W son inde- 
pendientes. 

De cada una de dos poblaciones normales con medias identicas y con desviaciones estandar de 6.40 y 
7.20, se toman muestras aleatorias independientes de 64 observaciones. Encuentre la probabilidad de 
que la diferencia entre las medias de las muestras exceda de .6 en valor absoluto. 

Si Y tiene una distribucion exponencial con media 9 , demuestre que U = 2 Y/6 tiene una distribution x 2 
con 2 grados de libertad. 

Un supervisor de planta esta interesado en asignar presupuesto a los costos semanales de reparaciones 
para cierto tipo de maquina. Los registros de anos pasados indican que estos costos de reparation tienen 
una distribucion exponencial con media de 20 para cada maquina estudiada. Denote con Y v Y 2 , . . . , Y 5 
los costos de reparation para cinco de estas maquinas durante la semana siguiente. Encuentre un nume- 
ro c tal que P(^Y^= 1 ^ = .0.5, suponiendo que las maquinas operan de manera independiente. 

[Sugerencia: use el resultado dado en el Ejercicio 7.93.] 

El coeficiente de variation (CV) para una muestra de valores Pj, Y 2 , . . . , Y n esta definido por 


CV = S/Y. 


Esta cantidad, que suministra la desviacion estandar como una proportion de la media, en ocasiones es 
informativa. Por ejemplo, el valor 5=10 tiene poco significado a menos que podamos compararlo con 
algo mas. Si se observa que 5 es igual a 10 y Y es igual a 1000, la cantidad de variation es pequena en 
comparacion con el tamano de la media. No obstante, si se observa que 5 es 10 y que Y es 5, la variation 
es bastante grande con respecto al tamano de la media. Si estuvieramos estudiando la precision (varia¬ 
tion en mediciones repetidas) de un instrumento de medicion, el primer caso (CV = 10/1000) podrfa 
dar una precision aceptable, pero el segundo caso (CV = 2) serfa inaceptable. 

Denote con Pj, Y 2 , . . . , Y w una muestra aleatoria de tamano 10 tomada de una distribucion normal 
con media 0 y varianza cr 2 . Use los siguientes pasos para determinar el numero c tal que 
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_2 

a Use el resultado del Ejercicio 7.33 para determinar la distribucion de (10) Y /S 2 . 
b Use el resultado del Ejercicio 7.29 para determinar la distribucion de 5 2 /[(10)E ]. 
c Use la respuesta al inciso b para determinar la constante c. 
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7.96 Suponga que y 2 , ..., y 40 denota una muestra aleatoria de mediciones de la proportion de irapurezas 
en muestras de mineral de hierro. Cada variable Y i tiene una funcion de densidad de probabilidad dada 
por 


[ 3y 2 , 0<v£l, 

/O0 = ' 

( 0, en cualquier otro punto. 


El mineral ha de ser rechazado por el comprador potencial si Y excede de .7. Encuentre P(Y > .7) para 
la muestra de tamano 40. 


*7.97 Sean X lt X 2 , . . . , X n variables aleatorias independientes y con distribution / y 2 , cada una con grado de 
libertad 1. Defina Y como 

y = ±x<- 

i =1 


Se deduce del Ejercicio 6.59 que Y tiene una distribution \ 2 con n grados de libertad. 

a Use la representation anterior de Y como la suma de las X para demostrar que Z = (Y —n)/\/2n 
tiene una distribution normal estandar asintotica. 

b Una maquina en una fabrica de equipo pesado produce varillas de acero de longitud Y, donde Y es 
una variable aleatoria distribuida normalmente con media de 6 pulgadas y varianza .2. El costo C de 
reparar una varilla que no mida exactamente 6 pulgadas de largo es proportional al cuadrado del error 
y esta dado, en dolares, por C = 4 (Y- /jl) 2 . Si 50 varillas con longitudes independientes se producen 
en un dfa determinado, aproxime la probabilidad de que el costo total de reparaciones para ese dfa 
exceda de $48. 

*7.98 Suponga que T se precisa como en la Definition 7.2. 

a Si W tiene un valor fijo w, entonces T esta dada por Z/c, donde c = Vw /v. Use esta idea para deter- 
minar la densidad conditional de T para una W = w fija. 

b Encuentre la densidad conjunta de T y W,f(t, w), usando/(f, w) = f(t\w) f(w). 

c Integre sobre w para demostrar que 

f 2\ H*+i)/2 

1 + — ) , oo < t < oo. 

V J 


fit) = 


r[(y + l)/2J 
\/nvY(v/7) 


*7.99 Suponga que F se precisa como en la Definition 7.3. 

a Si W-, esta fija en w 2 , entonces F = Wj/c, donde c = •w 2 y l /v 2 . Encuentre la densidad condicional de 
Fpara W, = w 2 fija. 

b Encuentre la densidad conjunta de F y W 2 . 

c Integre sobre w para demostrar que la funcion de densidad de probabilidad de F, g(y) por ejemplo, 
esta dada por 


g(j) 


nfoi +V2)/2](yi/v2) Vl/2 ( „ l/2) -i 
r(v 1 /2)r(y 2 /2) 


ny 

v 2 


—(‘’I +V2)/2 


0 < y < oo. 


*7.100 Sea X que tiene una distribution de Poisson con parametro A. 

a Demuestre que la funcion generadora de momento de Y = (X - A)/ VA esta dada por 


my(t) = exp(Ac'/^ — VXr — A). 


i/Va _ V- [f/VA]' 

4 - n 


b Use la expansion 
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*7.101 


*7.102 


*7.103 


*7.104 


*7.105 


para demostrar que 

lfm m Y (t) = e f2 / 2 . 

A —* oo 

c Use el Teorema 7.5 para demostrar que la funcion de distribucion de Y converge hacia una funcion de 
distribucion normal estandar cuando A —» oo. 

En el interes de controlar la contaminacion, un experimentador desea contar el numero de bacterias en 
un pequeno volumen de agua. Denote con X la cantidad de bacterias por centfmetro cubico de agua y su- 
ponga que X tiene una distribucion de probabilidad de Poisson con media A = 100. Si la contaminacion 
permisible en un suministro de agua es de 110 bacterias por centfmetro cubico, calcule la probabilidad 
de que X sea a lo sumo de 110. [Sugerencia: use el resultado del Ejercicio 7.100(c).] 

Se supone que Y, el numero de accidentes por ano en cierto crucero, tiene una distribucion de Poisson. 
En anos recientes, un promedio de 36 accidentes por ano han ocurrido en este crucero. Si el numero de 
accidentes por ano es al menos de 45, un crucero puede tener requisitos para ser redisenado dentro de un 
programa de emergencia establecido por el Estado. Calcule la probabilidad de que el crucero en cuestion 
entre en el programa de emergencia a fines del ano proximo. 

Un experimentador esta comparando dos metodos para remover colonias de bacterias contenidas en car- 
nes frfas. Despues de tratar algunas muestras mediante el metodo A y otras muestras con el metodo B, el 
experimentador selecciona una submuestra de 2 centimetres cubicos de cada muestra y hace la suma de 
la colonia de bacterias de las submuestras. Denote con X la cantidad total para las submuestras tratadas 
con el metodo A y denote con Y la cantidad total para las tratadas con el metodo B. Suponga que X y Y 
son variables aleatorias de Poisson independientes, con medias Aj y A 2 , respectivamente. Si X excede de 
Y en mas de 10, el metodo B sejuzgara mejor que el A. Suponga que, de hecho, Aj = A 2 = 50. Encuentre 
la probabilidad aproximada de que el metodo B sea considerado mejor que el metodo A. 

Sea Y n una variable aleatoria binomial con n intentos y con probabilidad p de exito. Suponga que n 
tiende al infinite y que p tiende a cere en forma tal que np continua fija en np = A. Use el resultado del 
Teorema 7.5 para demostrar que la distribucion de Y n converge hacia una distribucion de Poisson con 
media de A. 

Si la probabilidad de que una persona sufra de una reaccion adversa por un medicamento es .001, use el 
resultado del Ejercicio 7.104 para calcular la probabilidad de que 2 o mas personas sufran una reaccion 
adversa si el medicamento se administra a 100 personas. 
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8.2 Sesgo y error cuadratico medio de estimadores puntuales 

8.3 Algunos estimadores puntuales insesgados comunes 

8.4 Evaluacion de la bondad de un estimador puntual 
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8.8 Intervalos de confianza de una muestra pequena para /u. y /u, 1 - /jl 2 

8.9 Intervalos de confianza para a 2 

8.10 Resumen 

Bibliograffa y lecturas adicionales 


8.1 Introduccion 

Como lo establecimos en el Capftulo 1, el proposito de la estadfstica es usar la information 
contenida en una muestra para hacer inferencias acerca de la poblacion de la cual se toma la 
muestra. Debido a que las poblaciones estan caracterizadas por medidas descriptivas nume- 
ricas llamadas parametros, el objetivo de muchas investigaciones estadfsticas es calcular el 
valor de uno o mas parametros relevantes. Como veremos, las distribuciones muestrales obte- 
nidas en el Capftulo 7 desempenan un importante papel en el desarrollo de los procedimientos 
de estimacion que son el objetivo de este capftulo. 

La estimacion tiene muchas aplicaciones practicas. Por ejemplo, un fabricante de maquinas 
lavadoras podrfa estar interesado en estimar la proportion p de lavadoras que esperarfa que 
fallen antes de la expiration de la garantfa de un ano. Otros parametros poblacionales impor- 
tantes son la media poblacional, la varianza y la desviacion estandar. Por ejemplo, podrfamos 
estimar la media del tiempo de espera /jl en una caja registradora del supermercado o la desvia¬ 
cion estandar del error de medicion cr de un instrumento electronico. Para simplificar nuestra 
terminologfa, al parametro de interes le llamaremos pardmetro objetivo en el experimento. 
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DEFINICION 8.1 


Suponga que deseamos estimar la cantidad promedio /jl de mercurio que un proceso recien 
inventado puede eliminar de 1 onza de mineral obtenido de un lugar geografico determinado. 
Podrfamos dar nuestra estimacion o calculo en dos formas distintas. Primero, podrfamos usar 
un solo numero, por ejemplo .13 onzas, que consideramos es cercano a la media poblacional 
desconocida /jl. Este tipo de estimacion se llama estimacion puntual porque un solo valor o 
punto constituye la estimacion de /jl. En segundo termino podrfamos decir que /jl esta entre 
dos numeros, por ejemplo entre .07 y . 19 onzas. En este segundo procedimiento de estimacion 
los dos valores se pueden utilizar para construir un intervalo (.07, .19) que tiene la intention 
de encerrar el parametro de interes; entonces, la estimacion se denomina estimacion de inter¬ 
valo. 

La information de la muestra se puede emplear para calcular el valor de una estimacion 
puntual, una estimacion de intervalo o ambas. En cualquier caso, la estimacion real se logra 
con el uso de un estimador del parametro objetivo. 


Un estimador es una regia, a menudo expresada como una formula, que indica como 
calcular el valor de una estimacion con base en las mediciones contenidas en una mues¬ 
tra. 


Por ejemplo, la media muestral 


Y = 



es un posible estimador puntual de la media poblacional /jl. Claramente, la expresion para Y es 
una regia y una formula. Nos indica que sumemos las observaciones muestrales y dividamos 
entre el tamano muestral n. 

Un investigador que necesite una estimacion de intervalo de un parametro debe usar los 
datos muestrales para calcular dos valores, escogidos de tal modo que el intervalo que formen 
incluya el parametro objetivo con una probabilidad especffica. En las siguientes secciones se 
daran ejemplos de estimadores por intervalos. 

Muchos estimadores diferentes (reglas de estimacion) pueden obtenerse para el mismo 
parametro poblacional. Esto no debe ser sorprendente. Diez ingenieros, cada uno de ellos 
asignado a estimar el costo de un gran trabajo de construction, podrfan usar metodos diferen¬ 
tes de estimacion y por tanto llegar a diferentes evaluaciones del costo total. Estos ingenieros, 
llamados estimadores en la industria de la construction, basan sus estimaciones en lineamien- 
tos fijos especificados y en la intuition. Cada estimador representa una regia subjetiva humana 
unica para obtener una sola estimacion. Esto nos lleva a un punto mas importante: algunos es¬ 
timadores se consideran buenos y otros malos. La administration de una empresa constructora 
debe definir entre bueno y malo cuando en lo relacionado con la estimacion del costo de un 
trabajo. ^Como podemos establecer criterios de bondad para comparar estimadores estadfsti- 
cos? Las siguientes secciones contienen algunas respuestas a esta pregunta. 
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8.2 Sesgo y error cuadratico medio 
de estimadores puntuales 

La estimacion puntual es similar, en muchos aspectos, a disparar a un bianco con un revol¬ 
ver. El estimador, que genera estimaciones, es analogo al revolver; una estimacion particular 
es comparable a un tiro; y el parametro de interes corresponde al centra del bianco o diana. 
Extraer una sola muestra de una poblacion y usarla para calcular una estimacion del valor del 
parametro equivale a disparar un solo tiro al centro del bianco. 

Suponga que un hombre dispara un solo tiro y acierta en el centro del bianco. ^Concluimos 
que es un excelente tirador? ( ;Se atreverfa a sostener el bianco cuando se haga un segundo 
tiro? Obviamente, no podrfamos afirmar que el hombre es un experto tirador si nos basamos 
en tan pequena cantidad de evidencia. Por otra parte, si 100 tiros en sucesion aciertan en el 
bianco, podrfamos tener confianza suficiente en el tirador y considerar sostener el bianco para 
el siguiente tiro si la compensation es adecuada. La cuestion es que no podemos evaluar la 
bondad de un procedimiento de estimacion puntual con base en el valor de una sola estima¬ 
cion; mas bien, debemos observar los resultados cuando el procedimiento de estimacion se 
usa en innumerables veces. Como las estimaciones son numeros, evaluamos la bondad del 
estimador puntual al construir una distribucion de frecuencia de los valores de las estimacio¬ 
nes obtenidas en muestreo repetido y observar como se agrupa esta distribucion alrededor del 
parametro objetivo. 

Suponga que deseamos especificar una estimacion puntual para un parametro poblacional 
al que llamaremos 0. El estimador de 6 estara indicado por el sfmbolo 6, que se lee como 
“0 sombrero'’. El “sombrero” indica que estamos estimando el parametro que esta inme- 
diatamente bajo el. Con el ejemplo del disparo de revolver en mente, podemos decir que es 
altamente deseable que la distribucion de estimaciones —o bien, en forma mas apropiada, la 
distribucion muestral de estimaciones— se agrupe alrededor del parametro objetivo como se 
muestra en la Figura 8.1. En otras palabras, quisieramos que la media o valor esperado de la 
distribucion de estimaciones fuera igual al parametro estimado; esto es, E(6) = 0. Se dice 
que los estimadores puntuales que satisfacen esta propiedad son insesgcidos. La distribucion 
muestral para un estimador puntual sesgado positivamente, para el que E (0) > 0, se muestra 
en la Figura 8.2. 


FIGURA 8.1 
Distribucion de esti¬ 
maciones 



FIGURA 8.2 
Distribucion muestral 
para un estimador 
sesgado positiva¬ 
mente 
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DEFINICION 8.2 


DEFINICION 8.3 


DEFINICION 8.4 


FIGURA 8.3 
Distribuciones 
muestrales para dos 
estimadores insesga- 
dos: (a) estimador con 
variacion grande; (b) 
estimador con varia¬ 
cion pequena 


Si 9 es un estimador puntual de un parametro 9, entonces 9 es un estimador insesgado si 
E(9) = 0. Si E{9) t 6 9, se dice que 9 esta sesgado. 


El sesgo de un estimador puntual 9 esta dado por B(f>) = E(9) — 9. 


La Figura 8.3 muestra dos posibles distribuciones muestrales para los estimadores pun¬ 
tuales insesgados de un parametro objetivo 9. Preferirfamos que nuestro estimador tuviera 
el tipo de distribucion indicado en la Figura 8.3(b) porque una varianza pequena garantiza 
que, en un muestreo repetido, una fraction mas alta de valores de 9 2 estara “cerca” de 9. Por 
consiguiente, ademas de preferir un estimador insesgado, necesitamos que la varianza de la 
distribucion del estimador V(9) sea lo mas pequena posible. Dados dos estimadores insesga¬ 
dos de un parametro 9 seleccionarramos el estimador con la menor varianza mientras, todo lo 
demas permanece igual. 

Mas que usar el sesgo y la varianza de un estimador puntual para caracterizar su bondad, 
podnamos emplear E[(9 — 9) 2 ], el promedio del cuadrado de la distancia entre el estimador 
y su parametro objetivo. 


El error cuadratico medio de un estimador puntual 9 es 

MSE(0) = E[(9 -9) 2 ]. 


El error cuadratico medio de un estimador 9, MSE (6 ), es una funcion de su varianza y su 
sesgo. Si B{9) representa el sesgo del estimador 9, se puede demostrar que 

MSE(0) = V{9) + [fi(<9)] 2 . 

Dejaremos la demostracion de este resultado como Ejercicio 8.1. 

En esta seccion hemos definido propiedades deseables de los estimadores puntuales. En 
particular, a menudo buscamos estimadores insesgados con varianzas relativamente pequenas. 
En la siguiente seccion estudiaremos algunos estimadores puntuales insesgados comunes y 
utiles. 
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Ejercicios 

8.1 Usando la identidad 


(0 - 0) = [0 - E(6)] + [£(0) - 0] = [0 - £(0)] + 5(0), 


demuestre que 


MSE(0) = £[(0 - 0) 2 ] = V(6) + (6(0)) 2 . 


8.2 a Si 0 es un estimador insesgado para 0, ^,cual es 6(0)? 
b Si 6(0) = 5, ^cual es £(0)? 

8.3 Suponga que 0 es un estimador para un parametro 0 y £(0) = ad +b para algunas constantes diferentes 
de cero a y b. 

a En terminos de a, b, y 0, ^cual es 6(0)? 

b Encuentre una funcion de 0, por ejemplo 0,* que es un estimador insesgado para 0. 

8.4 Consulte el Ejercicio 8.1. 

a Si 0 es un estimador insesgado para 0, como se compara MSE(0) con V(0)? 
b Si 0 es un estimador insesgado para 0, como se compara MSE(0) con V(0)? 

8.5 Consulte los Ejercicios 8.1 y considere el estimador insesgado 0* que usted propuso en el Ejercicio 
8.3. 

a Exprese MSE (0*) como funcion de V (0). 

b De un ejemplo de un valor para a para el cual MSE(0*) < MSE(0). 
c De un ejemplo de valores para ay b para los cuales MSE(0*) > MSE(0). 

8.6 Suponga que £(0!) = £(0 2 ) = 0, V(0i) = of, y V(0 2 ) = of. Considere el estimador 0 3 = adi + 

(1 -fl) 0 2 . 

a Demuestre que 0 3 es un estimador insesgado para 0. 

b Si 0! y 0 2 son independientes, ^como debe escogerse la constante a para minimizar la varianza de 
03? 

8.7 Considere la situacion descrita en el Ejercicio 8.6. ^Como debe elegirse la constante a para minimizar 
la varianza de 0 3 , si § l y 0 2 no son independientes pero son tales que Cov (0i, 0 2 ) =c^0? 

8.8 Suponga que Ej, Y 2 , Y 3 denotan una muestra aleatoria de una distribution exponencial con funcion de 
densidad 


f(y) = 



y >0, 

en cualquier otro punto. 


Considere los siguientes cinco estimadores de 0: 


0i = Ei, 


0 2 = 


Yi+Y 2 

2 


0 3 = 


Yi + 2E 2 
3 


0 4 = min(E|, E 2 , E 3 ), 0 5 = E. 


a ^Cuales de estos estimadores son insesgados? 

b Entre los estimadores insesgados, ^cual tiene la varianza mas pequena? 
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Suponga que Ej, Y 2 ,..., Y n constituyen una muestra aleatoria de una poblacion con funcion de densidad 
de probabilidad 


f(y) 



y >0, 0>-l, 
en cualquier otro punto. 


Sugiera un estadlstico apropiado para usarlo como estimador insesgado para 0. [Sugerencia :considere Y.] 


El numero de descomposturas por semana para un tipo de minicomputadora es una variable aleatoria Y 
con una distribucion de Poisson y media A. Existe una muestra aleatoria Y v Y 2 ,. . ., Y n de observaciones 
del numero semanal de descomposturas. 


a Sugiera un estimador insesgado para A. 

b El costo semanal de reparar estas descomposturas es C = 3E + Y 2 . Demuestre que E(C) = 4A + A 2 , 
c Encuentre una funcion de E,, Y 2 , . . . ,Y n que sea un estimador insesgado de E(C). [Sugerencia: use 
lo que sepa acerca de Y y (E) 2 .] 

Sea Ej, E 2 , . . . , Y n una muestra aleatoria de tamano n de una poblacion con media 3. Suponga que 0 2 es 
un estimador insesgado de £(E 2 ) y que 0 3 es un estimador insesgado de E(Y 3 ). Proponga un estimador 
insesgado para el tercer momento central de la distribucion subyacente. 


La lectura en un voltlmetro conectado a un circuito de prueba esta distribuida uniformemente en el 
intervalo (0, 0+1), donde 0 es el valor desconocido del voltaje real del circuito. Suponga que Ej, 
E 2 , . . ., E„ denota una muestra aleatoria de esas lecturas. 

a Demuestre que E es un estimador sesgado de 0 y calcule el sesgo. 
b Encuentre una funcion de E que sea un estimador insesgado de 0. 
c Encuentre MSE(E) cuando E se use como estimador de 0. 

Hernos visto que si E tiene una distribucion binomial con parametros n y p, entonces E/n es un estima¬ 
dor insesgado de p. Para calcular la varianza de E, por lo general usamos n(E/n)(l - E/n). 

a Demuestre que el estimador sugerido es un estimador sesgado de V{Y). 
b Modifique ligeramente n(E/n)(l — E/n) para format' un estimador insesgado de V(E). 

Sea Ej, E 2 , . . . , Y n una muestra aleatoria de tamano n de una poblacion cuya densidad esta dada por 


fcn'““ 1 /0“, O<y<0, 

f(y)= n ' , . 

I 0, en cualquier otro punto, 

donde a > 0 es un valor fijo conocido, pero 0 no se conoce. (Esta es la familia de distribuciones de 
potencia introducidas en el ejercicio 6.17.) Considere el estimador 0 = max(E|, E 2 ,..., E„). 

a Demuestre que 0 es un estimador sesgado de 0. 
b Determine un multiplo de 0 que constituya un estimador de 0. 
c Deduzca MSE(0) 

Sea E[, E 2 ,.. . , Y n una muestra aleatoria de tamano n de una poblacion cuya densidad esta dada por 


/(.V) 


3)8 V 4 , (3 < y, 

0, en cualquier otro punto, 


donde (3 > 0 es desconocido. (Esta es una de las distribuciones de Pareto introducidas en el Ejercicio 
6.18.) Considere el estimador /3 = mm(Ei, E 2 ,..., E„). 

a Deduzca el sesgo del estimador /3. 
b Deduzca MSE(/3). 
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*8.16 Suponga que Y v Y 2 , . . . , Y n constituyen una muestra aleatoria de una distribucion normal con parame- 
tros /x y a 1 . 1 

a Demuestre que 5 — X^S 2 es un estimador sesgado de cr. [Sugerencia: recuerde la distribucion de 
(n - 1 )S 1 /cr 1 y el resultado dado en el Ejercicio 4.112.] 
b Ajuste S para formar un estimador insesgado de a. 

c Encuentre un estimador insesgado de /x - z a cr, el punto que corta un area de cola inferior de a bajo 
esta curva normal. 

8.17 Si Y tiene una distribucion binomial con parametros n y p, entonces p l = Y/n es un estimador insesga- 
do de p. Otro estimador de p es p 2 = (Y + 1 )/(n +2). 

a Deduzca el sesgo de p 2 . 

b Deduzca MSE(pi) y MSE(p 2 ). 

c ^Para que valores de p es MSE(pj) < MSE(p 2 )? 

8.18 Si Y v Y 2 , . . . , Y n representan una muestra aleatoria de tamano n de una poblacion con una distribucion 

uniforme en el intervalo (0, 6), considere a y (D = mm(Fj, Y 2 , , Y n ) el estadistico de orden mas bajo. 

Aplique los metodos de la Seccion 6.7 para deducir E(Y m ). Encuentre un multiplo de L) que sea un 
estimador insesgado para 6. 

8.19 Suponga que Y v Y 2 ,. . . , Y n denotan una muestra aleatoria de tamano n de una poblacion con una distri¬ 
bucion exponencial cuya densidad esta dada por 

/W -| J>0 ' 

I 0, en cualquier otro punto. 

Si F (1) = mfn(7|, Y 2 , . . . , Yj denota el estadistico de orden mas bajo, demuestre que 0 = n7(i) es un 
estimador insesgado para 6 y encuentre MSE (6). [Sugerencia: recuerde los resultados del Ejercicio 
6.81.] 

*8.20 Suponga que Y v K,, Y 3 , Y 4 denotan una muestra aleatoria de tamano 4 de una poblacion con una distri¬ 
bucion exponencial cuya densidad esta dada por 


y>«. 

I 0, en cualquier otro punto. 

a Sea X = \/Y\ Y 2 . Encuentre un multiplo de X que sea un estimador insesgado para 6 . [Sugerencia: 
use su conocimiento de la distribucion gamma y el hecho de que r( 1 /2) = \[tt para hallar £(\/Fi). 
Recuerde que las variables son independientes.] 

b Sea IV = V YiY 2 Y 3 Y 4 .. Encuentre un multiplo de IV que sea un estimador insesgado para d 2 . [Recuerde 
la sugerencia para el inciso a.] 


8.3 Algunos estimadores puntuales 
insesgados comunes 

Algunos metodos formales para obtener estimadores puntuales de parametros objetivo se pre- 
sentan en el Capitulo 9. En esta seccion nos concentramos en algunos estimadores que ameri- 
tan consideracion con base en la intuicion. Por ejemplo, parece natural usar la media muestral 
Y para estimar la media poblacional /x y usar la proporcion muestral p = Y/n para estimar 


1 Los ejercicios precedidos por un asterisco son opcionales. 
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un parametro binomial p. Si una inferencia esta basada en muestras aleatorias independientes 
de y n 2 observaciones seleccionadas de dos poblaciones diferentes, ^como estimariamos la 
diferencia entre medias (p ] - p 2 ) o la diferencia en dos parametros binomiales, (p 1 - p 2 )l De 
nuevo, nuestra intuicion sugiere utilizar los estimadores puntuales (Y\ — IV), la diferencia en 
las medias muestrales, para estimar (p { - p 2 ) y usar (pi — p 2 ), la diferencia en las proporcio- 
nes muestrales, para estimar (p 1 — p n ). 

Como los cuatro estimadores Y, p, ( Y\ — Y 2 ) y (pi — p 2 ) son funciones de las variables 
aleatorias observadas en muestras, podemos hallar sus valores y varianzas esperados con el 
uso de teoremas de esperanza de las Secciones 5.6-5.8. La desviacion estandar de cada uno 
de los estimadores es simplemente la raiz cuadrada de la varianza respectiva. Ese esfuer- 
zo demostrarfa que, cuando se ha empleado un muestreo aleatorio, los cuatro estimadores 
puntuales son insesgados y que poseen las desviaciones estandar mostradas en la Tabla 8.1. 
Para facilitar la exposition, usamos la notation cr| para denotar la varianza de la distribucion 
muestral del estimador 6. La desviacion estandar de la distribucion muestral del estimador 0, 

9, era = Jcri, suele recibir el nombre de error estandar del estimador 9. 

En el Capitulo 5 dedujimos gran parte de la information requerida para la Tabla 8.1. En 
particular, determinamos las medias y varianzas de Y y p en los Ejemplos 5.27 y 5.28, respec- 
tivamente. Si las muestras aleatorias son independientes, estos resultados y el Teorema 5.12 
implican que 


E(Y 1 - Y 2 ) = E(Y 1 ) - E(Y 2 ) =pi~ /x 2 , 

2 2 

V(Y 1 -Y 2 ) = V(Y 1 ) + V(Y 2 ) = ^L + ^. 

n 1 n 2 

El valor esperado y el error estandar de (pi — p 2 ), mostrados en la Tabla 8.1, se pueden ob- 
tener de un modo semejante. 


Tabla 8.1 Valores esperados y errores estandar de algunos estimadores puntuales comunes 


Parametro 


Estimador 


Error 

objetivo 

Tamano(s) 

puntual 

E(6) 

estandar 

e 

muestral(es) 

e 




_ 


(J 

P 

n 

Y 

P 

\/n 

P 

n 

Y 

P = - 
n 

P 

V n 





/ ? ? ++ 



_ _ 


a l , °2 

Pi ~ P 2 

til y n 2 

Y i — Y 2 

Pi ~ P2 

J— + ~ 

V n i n 2 

Pi ~ P2 

ill y n 2 

Pi ~ P2 

Pi ~ P2 

jpiqi + P 2 q 2 

V "1 n 2 


y son las varianzas de las poblaciones 1 y 2, respectivamente. 
t Se supone que las dos muestras son independientes. 
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Estimacion 


EJEMPLO 8.1 


Solucion 


Aun cuando la falta de sesgo es con frecuencia una propiedad deseable para un estimador 
puntual, no todos los estimadores son insesgados. En el Capftulo 1 definimos la varianza 
muestral como 


5 2_ E;'=i (Yi-Yf 

n — 1 

Es probable que haya parecido mas natural dividir entre n que entre n— 1 en la expresion 
anterior y calcular 


ga = T.U (Yi-Y) 2 ' 
n 

El Ejemplo 8.1 establece que S’ 2 y S 2 son, respectivamente, estimadores sesgados e insesga¬ 
dos de la varianza poblacional cr 2 . Inicialmente identificamos S 2 como la varianza muestral 
porque es un estimador insesgado. 


Sea Y v Y 2 , . . . , Y n una muestra aleatoria con E(Yl) = /j. y V(Yl) = cr 2 . Demuestre que 

S ' 2 = - V(E - Y) 2 
11 ' 


es un estimador sesgado para cr 2 y que 

S 2 = 

es un estimador insesgado para cr 2 . 

Se puede demostrar (Ejercicio 1.9) que 


^Ew-n 2 

i=i 


y}\=±Y 2 -nY\ 

i =1 i=l \i=1 / /=1 


En consecuencia, 


n 


~ Y) 2 


i=l 

r 2\ 


= E E Y ? ) - nE ^ Y ) = E £( ^ 2) - nE ( r >- 


11=1 


! = 1 


Observe que E{Yf) es la misma para i = 1,2Utilicemos esto y el hecho de que la 
varianza de una variable aleatoria esta dada nor V( Y) = E(Y 2 ) - | E( K)] 2 para concluir que 
E(Y 2 ) = V(Yi ) + [E(Yi)f = a 2 + p, 2 , E(Y) = V(Y) + [E{Y)f = a 2 ! n + p, 2 , y que 


- y ) 2 


i=1 


= B 


i = l 


cr 2 + p 2 ) — n I — + fi‘ 
n 


= n{cr + /jl ) — n\ — + /jl' 

V n 

= ncr 2 — a 2 = (n — l)cr 2 . 
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Se deduce que 


E(S' 2 ) = -E 
n 


- Y ) 2 


i =1 


= ~(n - 1 )a 2 = (- -- 1 cr 2 

n \ n 


y que S' 2 esta sesgada porque E(S' 2 ) i=- cr 2 . No obstante, 


E(S 2 ) = 


n — \ 


J2(Yi - Y) 2 


2=1 


n — \ 


(n ~ 1 )cr 2 = cr 2 , 


por tanto, vemos que .S' 2 es un estimador insesgado para cr 2 . 


Pueden hacerse dos comentarios finales respecto a los estimadores puntuales de la Tabla 
8.1. Primero, los valores esperados y los errores estandar para Y y Y\ — Y 2 dados en la tabla 
son validos cualquiera que sea la distribucion de la(s) poblacion(es) de donde se tome(n) la(s) 
muestra(s). En segundo termino, los cuatro estimadores poseen distribuciones de probabilidad 
que son aproximadamente normales para muestras grandes. El teorema del lfmite central jus- 
tifica este enunciado para Y y p, y teoremas similares para funciones de medias muestrales 
justifican la afirmacion para ( Y ] — Y 2 ) y (p ] — p 2 ) ■ <',Que tan grande es “grande”? Para casi 
todas las poblaciones la distribucion de probabilidad de Y tiene forma de campana incluso 
para muestras relativamente pequenas (de solo n = 5) y tendera rapidamente a la normalidad 
a medida que el tamano muestral se aproxime a n = 30 o mas grande. No obstante, a veces 
es necesario seleccionar muestras mas grandes tomadas de poblaciones binomiales porque el 
tamano muestral requerido depende de p. La distribucion de probabilidad binomial es perfec- 
tamente simetrica alrededor de su media cuando p = 1 /2 y se hace cada vez mas asimetrica 
cuando p tiende a 0 o 1. Como regia general, usted puede suponer que la distribucion de p 
tendra forma de campana y se aproximara a la normalidad para tamanos muestrales tales que p 
+ 3 ^lpq/n se encuentre en el intervalo (0, 1), o bien, como ya se demostro en el Ejercicio 7.70, 
si n > 9 (el mas grande de p y q)/(e\ mas pequeno de p y q). 

Sabemos que Y , /;, ( Y j —Y 2 ) y (pi ~p 2 ) son insesgados con distribuciones muestrales casi 
normales (al menos con forma de campana) para muestras de tamano moderado; ahora utili- 
cemos esta informacion para responder algunas preguntas practicas. Si usamos un estimador 
una sola vez y obtenemos una sola estimacion, c,que tan buena sera esta? ( \Cuanto podemos 
confiar en la validez de nuestra inferencia? Las respuestas a estas preguntas se proporcionan 
en la seccion siguiente. 


8.4 Evaluacion de la bondad 
de un estimador puntual 

Una forma de evaluar la bondad de cualquier procedimiento de estimacion puntual es en 
terminos de las distancias entre las estimaciones que genera y el parametro objetivo. Esta can- 
tidad, que varfa aleatoriamente en muestreo repetido, se denomina error de estimacion. Por 
supuesto que nos gustarfa que el error de estimacion fuera tan pequeno como sea posible. 
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DEFINICION 8.5 


F I G U R A 8.4 
Distribucion muestral 
de un estimador 
puntual# 


El error de estimacion e es la distancia entre un estimador y su parametro objetivo. Esto 
es, e = 1 6 - 6\. 


Como 9 es una variable aleatoria, el error de estimacion tambien es una cantidad aleatoria 
y no podemos decir que tan grande o pequeno sera para una estimacion particular, pero po- 
demos plantear enunciados de probabilidad acerca de el. Por ejemplo, suponga que 9 es un 
estimador insesgado de 9 y tiene una distribucion muestral como se muestra en la Figura 8.4. 
Si seleccionamos dos puntos, (0 — b) y (6 + b), situados cerca de las colas de la densidad de 
probabilidad, la probabilidad de que el error de estimacion s sea menor que b esta representa- 
da por el area sombreada de la Figura 8.4. Esto es, 

P(\9 - 9\ < b) = P[—b < (6 - 9) < b] = P(9 - b < § < 9+ b). 

Podemos considerar a b como un lrmite probabilrstico en el error de estimacion. Aun cuan- 
do no estamos seguros de que un error determinado sea menor que b, la Figura 8.4 indica que 
P(e < b) es alto. Si b se puede considerar desde un punto de vista practico como pequeno, 
entonces Pie < b) da una medida de la bondad de una sola estimacion. Esta probabilidad iden- 
tifica la fraccion de veces, en muestreo repetido, que el estimador 9 cae dentro de b unidades 
de 9, el parametro objetivo. 

Suponga que deseamos hallar el valor de b para que P(e < b) = .90. Esto es facil si conoce- 
mos la funcion de densidad de probabilidad de 9. Entonces buscamos un valor b tal que 

pO+b 

/ f(9)d9 = . 90. 

Je-b 

Pero ya sea que conozcamos o no la distribucion de probabilidad de 9, si 9 es insesgado 
podemos hallar un lrmite aproximado en e al expresar b como un multiplo del error estandar 
de 9 (recuerde que el error estandar de un estimador es simplemente un nombre alternativo 
conveniente para la desviacion estandar del estimador.) Por ejemplo, para k > 1, si hacemos 
b = kcrjj, sabemos por el teorema de Tchebysheff que e sera menor que k(r- H con probabilidad 
de al menos 1-1/A: 2 . Un valor de A comodo y de uso frecuente es A = 2. En consecuencia, 
sabemos que e sera menor que b = 2cr§ con probabilidad de al menos .75. 

Usted encontrara que, con probabilidad en la cercanra de .95, muchas variables aleatorias 
observadas en la naturaleza se encuentran a no mas de 2 desviaciones estandar de sus medias. 
La probabilidad de que Y se encuentre en el intervalo (/i + 2 cr) se muestra en la Tabla 8.2 para 
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Tabla 8.2 Probabilidad de que (/x 

—2 a) <Y< (/ jl+2(t ) 

Distribucion 

Probabilidad 

Normal 

.9544 

Uniforme 

1.0000 

Exponencial 

.9502 


las distribuciones de probabilidad normal, uniforme y exponencial. El punto es que b = 2 a$ 
es un buen lrnrite aproximado para el error de estimacion en casi todas las situaciones practi- 
cas. De acuerdo con el teorema de Tchebysheff, la probabilidad de que el error de estimacion 
sea menor que este I finite es al menos .75. Como ya se seiralo, los lrmites para probabilidades 
dados por el teorema de Tchebysheff suelen ser muy conservadores; las probabilidades reales 
por lo general exceden los limites de Tchebysheff en una cantidad considerable. 


EJEMPLO 8.2 Una muestra de n = 1000 votantes, seleccionados al azar en una ciudad, mostro y = 560 a 
favor del candidato Jones. Estime p, la fraccion de votantes de la poblacion que estan a favor 
de Jones y precise un lrmite de error estandar de 2 en el error de estimacion. 

Solucion Utilizaremos el estimador p = Y/n para calcular p. Por tanto, la estimacion de p, la fraccion 
de votantes que estan a favor del candidato Jones, es 


y 

n 


560 

Tooo 


= .56. 


( ',Que tan confiable es este valor? La distribucion de probabilidad de p se aproxima en 
forma muy precisa mediante una distribucion de probabilidad normal para muestras grandes. 
Como n = 1000, cuando b = 2 crp, la probabilidad de que e sea menor que b es aproximada- 
mente .95. 

De la Tabla 8.1, el error estandar del estimador para p esta dado por ap =\f~pq~Jn. Por 
tanto, 


b = 2ap = 2, 


Desafortunadamente, para calcular b necesitamos conocer p y determinar el valor de p fue el 
objetivo de nuestro muestreo. No obstante, este empate aparente no es una desventaja porque 
ap varfa poco para cambios pequenos de p. Por tanto, la sustitucion de la estimacion p por p 
produce un error pequeno en el calculo del valor exacto de b = 2ap. Entonces, para nuestro 
ejemplo, tenemos 



(,56)(.44) 

1000 


= .03. 


(,CuaI es la importancia de nuestros calculos? La probabilidad de que el error de estimacion 
sea menor que .03 es aproximadamente .95. En consecuencia, podemos tener una confianza 
razonable de que nuestra estimacion, .56, esta a no mas de .03 del valor verdadero de p. la 
proporcion de votantes en la poblacion que esta a favor de Jones. ■ 
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EJ EMPLO 8.3 Una comparacion de la durabilidad de dos tipos de llantas para automovil se obtuvo de mues- 
tras de pruebas en carretera de n x = n 2 = 100 llantas de cada tipo. Se registro el numero de 
millas hasta quedar inutiles, el desgaste se definio como el numero de millas hasta que la 
cantidad restante de superficie de rodamiento llego a un valor pequeno especificado previa- 
mente. Las mediciones para los dos tipos de llantas se obtuvieron de manera independiente y 
se calcularon las siguientes medias y varianzas: 

y l = 26,400 millas, y 2 = 25,100 millas, 

s\ = 1,440,000, s\ = 1,960,000. 

Estime la diferencia en la media de millas hasta quedar inutiles y precise un limite de error 
estandar de 2 en el error de estimacion. 


Solucion La estimacion puntual de - /jl 2 ) es 


(Ji - y 2 ) = 26,400 - 25,100 = 1300 millas. 


y el error estandar del estimador (vea Tabla 8.1) es 


a iYi-Y 2 ) 



Debemos conocer of y <x 2 f o tener buenos valores aproximados de ellas para calcular fr i;y, y 2) . 
Con frecuencia se pueden calcular valores razonablemente precisos de oy y of a partir de 
datos experimentales similares, recolectados algun tiempo antes, o se pueden obtener de datos 
muestrales actuales mediante el uso de los estimadores insesgados 


= S} = 


rii 


i 

7=1 


YiY 


= 1 , 2 . 


Estas estimaciones seran adecuadas si los tamanos muestrales son razonablemente grandes, 
por ejemplo /i 7 > 30, para i = 1,2. Los valores calculados de S x y S|, basados en las dos prue¬ 
bas de desgaste, son sf = 1,440,000 y ,sf = 1,960,000. Sustituyendo estos valores por of y 
of en la formula para o^ y x -Y 2 )> tenemos 

/1,440,000 1,960,000 

V 100 + Too 

= -y/34,000 = 184.4 millas. 



En consecuencia, estimamos que la diferencia en desgaste medio es de 1300 millas y espera- 
mos que el error de estimacion sea menor que 2a (Yl -k 2 ), 0 sea 368.8 millas, con una probabi- 
lidad de aproximadamente .95. ■ 


Ejercicios 

8.21 Un investigador esta interesado en la posibilidad de unir las aptitudes de television e Internet. Una mues- 
tra aleatoria de n = 50 usuarios de Internet dio que el tiempo medio semanal empleado en ver television 
era de 11.5 horas y que la desviacion estandar era de 3.5 horas. Estime el tiempo medio poblacional que 
los usuarios de Internet pasan viendo television y fije un limite para el error de estimacion. 
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8.22 Es frecuente que un aumento en el porcentaje de ahorros de los consumidores se encuentre ligado a la 
falta de confianza en la economla y se dice que es un indicador de una tendencia recesiva en aquella. Un 
muestreo aleatorio de n = 200 cuentas de ahorros en una comunidad local mostro que el aumento medio 
en los valores de las cuentas de ahorros era de 7.2% en los ultimos 12 meses, con desviacion estandar de 
5.6%. Estime el porcentaje medio de aumento en los valores de las cuentas de ahorros en los ultimos 12 
meses para depositantes de la comunidad. Establezca un llmite para su error de estimation. 

8.23 La Environmental Protection Agency en conjunto con la Universidad de Florida recientemente realizo 
un amplio estudio de los posibles efectos de trazas de elementos en el agua potable sobre la formation 
de calculos renales. La tabla siguiente presenta datos de edad, cantidad de calcio en agua potable (me- 
dida en partes por millon) y habitos de fumar. Estos datos se obtuvieron de individuos con problemas 
actuales de calculos renales, todos los cuales vivlan en las dos Carolinas y en estados de las Montanas 
Rocallosas. 



Carolinas 

Rocallosas 

Tamano muestral 

467 

191 

Edad promedio 

45.1 

46.4 

Desviacion estandar de edad 

10.2 

9.8 

Componente medio de calcio (ppm) 

11.3 

40.1 

Desviacion estandar del calcio 

16.6 

28.4 

Proportion de fumadores en 
el momento del estudio 

.78 

.61 


a Estime la concentration promedio de calcio en el agua potable para pacientes con calculos renales en 
las Carolinas. Establezca un lfmite para el error de estimation. 

b Calcule la diferencia en edades medias para pacientes con calculos renales en las Carolinas y en las 
Rocallosas. Fije un llmite para el error de estimation. 

c Calcule y precise un llmite de desviacion estandar de 2 en la diferencia en proporciones de pacientes 
con calculos renales, de las Carolinas y las Rocallosas, que eran fumadores en el momento de hacer 
el estudio. 

8.24 Los resultados de una encuesta de opinion publica publicados en la Internet 2 indicaron que 69% de quie- 
nes respondieron clasificaron el costo de la gasolina como una crisis o problema importante. El artlculo 
indica que 1001 adultos, de 18 anos o mas, fueron entrevistados y que los resultados tienen un error de 
muestreo de 3%. ^Como se calculo el 3% y como deberfa interpretarse? ^Podemos concluir que una 
mayorla de los individuos del grupo de mayores de 18 anos pensaron que el costo de la gasolina era una 
crisis o problema importante? 

8.25 Se realizo un estudio para comparar el promedio de llamadas de emergencia a la policla en cada tumo de 
8 horas en dos distritos de una ciudad grande. Se seleccionaron aleatoriamente muestras de 100 turnos 
de 8 horas de los registros policfacos para cada una de las dos regiones y se registro el numero de llama¬ 
das de emergencia para cada tumo. Los estadlsticos muestrales se proporcionan en la tabla siguiente. 


Region 

1 2 

Tamano muestral 

100 

100 

Media muestral 

2.4 

3.1 

Varianza muestral 

1.44 

2.64 


2 Fuente: Jeffrey M. Jones, “CNN/USA Today/Gallup Poll—Public Expects Gas Price Increase To Be Permanent,” 
http:www.gallup.com/content/print/.aspx?ci=l 1257,8 de abril de 2004. 
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a Calcule la diferencia en el numero medio de llamadas de emergencia a la policfa por turno de 8 horas 
entre los dos distritos de la ciudad. 
b Encuentre un li'mite para el error de estimacion. 

8.26 Los vehfculos gemelos Spirit y Opportunity , que recorrieron la superficie de Marte en el invierno de 
2004, hallaron evidencia de que una vez hubo agua en el planeta, elevando la posibilidad de que una vez 
hubo vida en el mismo. ^.Piensa usted que Estados Unidos deberfa continuar un programa para enviar 
seres humanos a Marte? Una encuesta de opiniones 3 indico que 49% de los 1093 adultos encuestados 
piensa que se deberfa continuar ese programa. 

a Estime la proportion de todos los norteamericanos que piensan que Estados Unidos deberfa continuar 
un programa para enviar seres humanos a Marte. Encuentre un li'mite en el error de estimacion. 
b La encuesta en realidad formulo varias preguntas. Si quisieramos informar un error de estimacion 
que serfa valido para todas las preguntas de la encuesta, f,que valor deberfamos usar? [Sugerencia: 
^cual es el maximo valor posible para p X ql] 

8.27 Una muestra aleatoria de 985 “probables votantes” —a quienes se considera que probablemente voten 
en una election proxima— fueron encuestados durante una indagacion por telefono realizada por el par- 
tido republicano. De aquellos contactados, 592 indicaron que tenfan intention de votar por el candidato 
republicano en la election. 

a De acuerdo con este estudio, la estimation para p, la proportion de todos los “posibles votantes" que 
votaran por el candidato republicano, es p — .601. Encuentre un lfmite para el error de estimacion. 
b Si los “probables votantes” son representativos de quienes realmente votaran, ^piensa usted que el 
candidato republicano sera elegido? ^Por que? f,Que confianza tiene usted en su decision? 
c ^Puede usted dar razones por las que los encuestados podrfan no ser representativos de los que en 
realidad voten en la election? 

8.28 En un estudio de la relation entre orden de nacimiento y exito universitario, un investigador encontro 
que 126 en una muestra de 180 egresados de universidad fueron hijos primogenitos o hijos unicos; en 
una muestra de 100 no egresados de edad y antecedentes socio economicos comparables, el numero de 
primogenitos o hijos unicos era de solo 54. Estime la diferencia en las proporciones de primogenitos o 
hijos unicos para las dos poblaciones de las que se tomaron estas muestras. Establezca un lfmite para el 
error de estimacion. 

8.29 En ocasiones las encuestas dan information interesante acerca de cuestiones que no parecieron ser de 
interes en la encuesta inicialmente. Los resultados de dos encuestas de la CNN/USA Today/Gallup, 
una de ellas efectuada en marzo de 2003 y otra en noviembre de 2003, fueron presentados recientemente 
en lfnea. 4 Ambas encuestas comprendieron muestras de 1001 adultos, de 18 anos de edad o mas. En la 
muestra de marzo, 45% de los muestreados dijeron ser aficionados al beisbol profesional mientras que 
51% de los encuestados en noviembre dijeron ser aficionados. 

a De una estimacion puntual para la diferencia en las proporciones de estadounidenses que dicen ser 
aficionados al beisbol en marzo (al principio de la temporada) y noviembre (despues de la serie mun- 
dial). Proporcione un lfmite para el error de estimacion. 
b (,Hay suficiente evidencia para concluir que el apoyo de los aficionados es mayor al final de la tem¬ 
porada? Explique. 


3 Fuente: “Space Exploration," Associated Press Poll. http:www.pollingreport.eom/science.htm#Space, 5 de abril 
de 2004. 

4 Fuente: Mark Gillespie, “Baseball Fans Overwhelmingly Want Mandatory Steroid Testing,” http:www.gallup.com/ 
content/print.aspx?ci=l 1245. 14 de febrero de 2004. 
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8.30 Consulte el Ejercicio 8.29. De la estimacion puntual y un lfmite para el error de estimation de la propor¬ 
tion de adultos que hubieran dicho que eran aficionados al beisbol en marzo de 2003. ^Es probable que 
el valor de su estimation se desvfe hasta en 10%? ^Por que? 

8.31 En un estudio para comparar los efectos percibidos de dos calmantes para el dolor, a 200 adultos selec- 
cionados aleatoriamente se les dio el primer calmante y 93% indicaron un alivio considerable del dolor. 
De los 450 a quienes se dio otro calmante para el dolor, 96% indicaron haber experimentado mejorfa 
apreciable. 

a De una estimacion para la diferencia en las proporciones de todos los adultos que indicarfan sentir 
alivio del dolor percibido despues de tomar los dos calmantes. Precise un lfmite para el error de esti¬ 
mation. 

b Con base en su respuesta al inciso a, ^existe evidencia de que las proporciones de los que experimen- 
tan alivio difieran de los que toman los dos calmantes para el dolor? r,Por que? 

8.32 Un auditor muestrea aleatoriamente 20 cuentas por cobrar de entre 500 de esas cuentas de la empresa 
de un cliente. El auditor hace una lista de la cantidad de cada cuenta y verifica si los documentos que 
sirven de base cumplen con los procedimientos estipulados. Los datos se registran en la tabla siguiente 
(las cantidades son en dolares, Y = si y N = no). 


Cuenta 

Cantidad 

Cumple 

Cuenta 

Cantidad 

Cumple 

1 

278 

Y 

11 

188 

N 

2 

192 

Y 

12 

212 

N 

3 

310 

Y 

13 

92 

Y 

4 

94 

N 

14 

56 

Y 

5 

86 

Y 

15 

142 

Y 

6 

335 

Y 

16 

37 

Y 

7 

310 

N 

17 

186 

N 

8 

290 

Y 

18 

221 

Y 

9 

221 

Y 

19 

219 

N 

10 

168 

Y 

20 

305 

Y 


Estime el total de cuentas por cobrar para las 500 cuentas de la empresa y fije un lfmite para el error de 
estimacion. ^Piensa usted que el promedio de cuentas por cobrar para la empresa es mayor a $250 dola¬ 
res? ^,Por que? 

8.33 Consulte el Ejercicio 8.32. De los datos obtenidos en las revisiones de cumplimiento, estime la propor¬ 
tion de las cuentas de la empresa que no cumplen con los procedimientos estipulados. Precise un lfmite 
para el error de estimacion. ^Piensa usted que la proportion de cuentas que cumplen con los procedi¬ 
mientos estipulados es mayor que 80%? ^Por que? 

8.34 Podemos definir un lfmite de desviacion estandar 2 en el error de estimacion con cualquier estimador 
para el cual podamos hallar una estimation razonable del error estandar. Suponga que Fj, F,, ..., Y n 
representan una muestra aleatoria de una distribution de Poisson con media A. Sabemos que V(Y t ) — A, 
y por tanto que E(Y) = A y V(Y) = A In- f,C6mo emplearfa usted r 2 , para estimar A ? ^,Como 
estimarfa el error estandar de su estimador? 

8.35 Consulte el Ejercicio 8.34. En el aluminio policristalino, la cantidad de puntos de nucleacion de grano 
por unidad de volumen esta modelada con una distribution de Poisson con media A. Cincuenta especf- 
menes de prueba de volumen unitario sometidos a recocido con el regimen A produjeron un promedio de 
20 puntos por volumen unitario. Cincuenta especfmenes de prueba de volumen unitario seleccionados 
de manera independiente sometidos a recocido con el regimen B produjeron un promedio de 23 puntos 
por volumen unitario. 





406 


Capftulo8 Estimacion 


a Estime la media A a del numero de puntos de nucleacion para el regimen A y precise un limite de error 
estandar de 2 en el error de estimacion. 

b Estime la diferencia en la media del numero de puntos de nucleacion A a - A B para los regfmenes A y 
B. Establezca un limite de error estandar de 2 para el error de estimacion. ^Se diria que el regimen B 
tiende a producir un promedio mayor de puntos de nucleacion? ^Por que? 

8.36 Si fj, Y 2 , .... Y„ denotan una muestra aleatoria de una distribution exponential con media 9, entonces 
E(Y J) = 9 y V(Yi) = 9 2 . Entonces, E(Y) =9 y V{Y) = 9 2 /n o ay =9/y/n. Sugiera un estimador 
insesgado para 9 y de una estimacion para el error estandar del estimador sugerido. 

8.37 Consulte el Ejercicio 8.36. Un ingeniero observa n = 10 mediciones independientes de la duration de 
un componente electronico. El promedio de estas 10 mediciones es de 1020 horas. Si estas duraciones 
provienen de una distribution exponencial con media 9, estime 9 y ponga un limite de error estandar de 
2 en el error de estimation. 

8.38 El numero de personas que acuden a un banco de sangre hasta que se encuentra la primera de ellas con 
sangre tipo A es una variable aleatoria Y con distribution geometrica. Si p denota la probabilidad de 
que cualquier persona seleccionada aleatoriamente posea sangre tipo A, entonces E(Y) = l/p y V(Y) = 
(1 -P)/P 2 - 

a Determine una funcion de Y que sea un estimador insesgado de V(Y). 

b Sugiera una forma de establecer un limite de error estandar de 2 para el error de estimacion cuando 
Y se use para calcular 1 /p. 


8.5 Intervalos de confianza 

Un estimador de intervalo es una regia que especifica el metodo para usar las mediciones 
muestrales en el calculo de dos numeros que forman los puntos extremos del intervalo. En el 
caso ideal, el intervalo resultante tiene dos propiedades: primero, contiene el parametro ob- 
jetivo 0; en segundo, su amplitud sera relativamente pequena. Uno o ambos puntos extremos 
del intervalo, siendo funciones de las mediciones muestrales, variaran aleatoriamente de una 
muestra a otra. Entonces, la longitud y ubicacion del intervalo son cantidades aleatorias; no 
podemos estar seguros de que el parametro objetivo 9 (fijo) caiga entre los puntos extremos 
de cualquier intervalo individual calculado a partir de una sola muestra. En este caso, nuestro 
objetivo es hallar un estimador de intervalo capaz de generar intervalos estrechos que tengan 
una alta probabilidad de incluir a 6. 

Los estimadores de intervalo suelen recibir el nombre de intervalos de confianza. Los pun¬ 
tos extremos superior e inferior de un intervalo de confianza se denominan limites de con¬ 
fianza superior e inferior, respectivamente. La probabilidad de que un intervalo de confianza 
(aleatorio) incluya a 6 (una cantidad fija) se llama coeficiente de confianza. Desde un punto de 
vista practico, el coeficiente de confianza identifica la fraction de veces, en muestreo repetido, 
que los intervalos construidos contienen al parametro objetivo 6. Si sabemos que el coeficiente 
de confianza asociado con nuestro estimador es alto, podemos estar suficentemente seguros 
de que cualquier intervalo de confianza, construido con el uso de los resultados de una sola 
muestra, contendra a 0. 

Suponga que 0 L y 6 u son los lfmites de confianza (aleatorios) superior e inferior, respecti¬ 
vamente, para un parametro 0. Entonces, si 


P (0 L < 9 < 0 V ) = 1 ~ a. 
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EJEMPLO 8.4 

Solucion 


la probabilidad (1 - a) es el coeficiente de confianza. El intervalo aleatorio resultante definido 
por [ (j L; gyj se denomina intervalo de confianza bilateral. 

Tambien es posible formar un intervalo de confianza unilateral tal que 

P (0 L < 9) = 1 - a. 

Aim cuando solo 0l es aleatorio en este caso, el intervalo de confianza es [Or, oo ). Del mismo 
modo, podriamos tener un intervalo de confianza unilateral superior tal que 

P(0 <0u) = 1 - a. 

El intervalo de confianza implicado aquf es (— oo, 0 y |. 

Un metodo muy util para encontrar intervalos de confianza se llama metodo del pivote. Este 
consiste en determinar una cantidad que actue como pivote y que posea las dos caracterfsticas 
siguientes: 

1. Que sea una funcion de las medidas muestrales y el parametro desconocido 0, donde 0 
sea la unica cantidad desconocida. 

2. Que su distribucion de probabilidad no dependa del parametro 6. 

Si se conoce la distribucion de probabilidad de la cantidad que actua como pivote, el siguiente 
procedimiento logico puede usarse para obtener la estimacion por intervalos deseada. Si Y es 
cualquier variable aleatoria, c > 0 es una constante y P(a < Y < b) = . 7; entonces ciertamente 
P(ca < cY < cb ) = .7. Del mismo modo, para cualquier constante d, P(a + i/ < Y + d ^ b 
+ d) = .7. Esto es, la probabilidad del evento (« < K < b) no resulta afectada por un cambio 
de escala o una traslacion de Y. Entonces, si conocemos la distribucion de probabilidad de una 
cantidad pivote, podemos usar operaciones como estas para formar la estimacion por interva¬ 
los que buscamos. Ilustramos este metodo con los ejemplos siguientes. 


Suponga que obtenemos una sola observacion Y de una distribucion exponencial con media 0. 
Use Y para construir un intervalo de confianza para 0 con un coeficiente de confianza de .90. 


La funcion de densidad de probabilidad para Y esta dada por 


f(y) 



0, en cualquier otro punto. 


Por el metodo de transformaciones del Capftulo 6 podemos ver que U = Y/0 tiene la funcion 
de densidad exponencial dada por 

1 u > 0, 

ftj(u) = | 

l 0, en cualquier otro punto. 

La funcion de densidad para U aparece graficada en la Figura 8.5. U = Y/0 es una funcion 
de Y (la medicion muestral) y 0, y la distribucion de U no depende de 0. Entonces, podemos 
emplear U = Y/0 como cantidad pivote. Como buscamos un estimador de intervalo con 
coeficiente de confianza igual a .90, encontramos dos numeros ay b tales que 


P(a < U < b) = .90. 
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F I G U R A 8.5 
Funcion de densidad 
para U, Ejemplo 8.4 



Una forma de hacer esto es elegir ay b para satisfacer 


P{U < a) = j e " du = .05 y P(U > b) = / e U du = .05. 

Estas ecuaciones dan como resultado 

1 — e a = .05 y e b = .05 o bien, a = .051, b = 2.996. 

Por consiguiente 


r 


.90 = P(.051 < U < 2.996) = P ( .051 < - < 2.996 


Como estamos buscando un estimador de intervalo para 9, manipulamos las desigualdades 
que describen el evento para aislar 6 en el centra. Y tiene una distribucion exponencial, de 
modo que P(Y > 0) = 1 y mantenemos la direccion de las desigualdades si dividimos todo 
entre Y. Esto es, 


.90 = P 


^.051 < ^ <2.996^ 



1 < 2.996\ 

9 “ Y ) ' 


Tomando reciprocos (y por tanto invirtiendo la direccion de las desigualdades) obtenemos 

P 

Entonces, vemos que Y/2.99b y E/.051 forman los limites de confianza inferior y superior, 
respectivamente, que estabamos buscando. Para obtener los valores numericos de estos limi¬ 
tes debemos observar un valor real para Y y sustituirlo en las formulas dadas para los limites 
de confianza. Sabemos que limites de la forma (Y/ 2.996, K/.05 I) incluiran los valores (des- 
conocidos) verdaderos de 9 para 90% de los valores de Y que obtendriamos por muestreo 
repetido a partir de esta distribucion exponencial. ■ 


f—V 

v 2.996 .051 J 


, Y Y 

.90 = P\ -> 0 >- 

.051 2.996 


EJ EM PLO 8.5 Suponga que tomamos una muestra de tarnano n = 1 de una distribucion uniforme definida en 
el intervalo [0, 9 ], donde 9 es desconocida. Encuentre un limite de confianza inferior de 95% 
para 9. 

Solucion Como Y es uniforme en [0, 6], los metodos del Capitulo 6 se pueden usar para demostrar que 
U = Y/9 esta uniformemente distribuida en [0, 1]. Esto es, 

[1, 0 — w — 1, 

Mu) = 

[ 0, en cualquier otro punto. 











Ejercicios 409 


FIGURA 8.6 
Funcion de densidad 
para U, Ejemplo 8.5 



La figura 8.6 contiene una grafica de la funcion de densidad para U. De nuevo, vemos que U 
satisface los requisitos de una cantidad pivote. Como buscamos un li'mite de confianza inferior 
de 95% para 9, determinamos el valor para a de modo que P(U < a) = .95. Esto es, 

(1 )du = .95, 

o sea que a = .95. Por tanto, 

P(U < .95) = P < .95^ = P(Y < .95 9) = P < 9^j = .95. 

Vemos que Y /.95 es un lfmite de confianza inferior para 9, con coeficiente de confianza .95. 
Como cualquier Y observada debe ser menor que 9 , es intuitivamente razonable tener el lfmite 
de confianza inferior para 9 ligeramente mayor que el valor observado de Y. ■ 



Los dos ejemplos anteriores ilustran el uso del metodo del pivote para determinar lfmites 
de confianza para parametros desconocidos. En cada caso las estimaciones de intervalo se 
desarrollaron con base en una sola observacion de la distribucion. Estos ejemplos se presen- 
taron basicamente para ilustrar el metodo del pivote. En las secciones restantes de este capf- 
tulo usaremos este metodo en coordination con las distribuciones de muestreo presentadas 
en el Capftulo 7 para desarrollar algunas estimaciones por intervalos de mayor importancia 
practica. 


Ejercicios 

8.39 Suponga que la variable aleatoria Y tiene una distribucion gamma con parametros a = 2 y [3 desconoci- 
da. En el Ejercicio 6.46 usted utilizo el metodo de las funciones generadoras de momento para dernos- 
trar un resultado general que implicaba que 2 Y/f3 tiene una distribucion x 2 con 4 grados de libertad. 
Usando 2Y//3 como cantidad pivote, deduzca un intervalo de confianza de 90% para f3. 

8.40 Suponga que la variable aleatoria Y es una observacion de una distribucion normal con media /x desco- 
nocida y varianza 1. Encuentre un 

a intervalo de confianza de 95% para /x, 
b lfmite de confianza superior de 95% para /x, 
c lfmite de confianza inferior de 95% para /x. 

8.41 Suponga que Y esta distribuida normalmente con media 0 y varianza cr 2 desconocida. Entonces F 2 /cr 2 
tiene una distribucion x 2 con grado de libertad 1. Use la cantidad pivote Y 2 /er 2 para hallar un 
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a intervalo de confianza de 95% para a 2 , 
b limite de confianza superior de 95% para a 1 , 
c limite de confianza inferior de 95% para cr. 

8.42 Use las respuestas del Ejercicio 8.41 para hallar un 

a intervalo de confianza de 95% para cr, 
b limite de confianza superior de 95% para cr, 
c limite de confianza inferior de 95% para <x. 

8.43 Sea Jj, Y 2 , . . . , Y„ una muestra aleatoria de tamano n de una poblacion con distribucion uniforme en el 
intervalo"(0, 8). Sean Y (n) = maxi^, Y 2 , . . . , Y n ) y U= (l/6)Y (ny 

a Demuestre que U tiene funcion de distribucion 


Fu(u) 


0, u < 0, 

u n , 

1, u > 1. 


b Como la distribucion de U no depende de 6 , U es una cantidad pivote. Encuentre un limite de con¬ 
fianza inferior de 95% para 8. 

8.44 Suponga que Y tiene la siguiente funcion de densidad de probabilidad 


8.45 


8.46 


f 2(0 ~ y) 
My) = | e 2 
l o. 


0 <y < e, 

en cualquier otro punto. 


)emuestre 


que Y tiene funcion de distribucion 


Fy (y) 


0, 

2y 


z: 


y £0, 

0 < y < e. 


b Demuestre que Y/6 es una cantidad pivote. 

c Use la cantidad pivote del inciso b para hallar un limite de confianza inferior de 90% para 0. 
Consulte el Ejercicio 8.44. 

a Use la cantidad pivote del Ejercicio 8.44(b) para hallar un limite de confianza superior de 90% para 
8 . 


b Si §l es el limite de confianza inferior para 6 obtenido en el Ejercicio 8.44(c) y §u es el limite supe¬ 
rior hallado en el inciso a, ),cual es el coeficiente de confianza del intervalo ( d L , 8v)7 


Consulte el Ejemplo 8.4 y suponga que Y es una sola observation de una distribucion exponential con 
media 8. 


a Use el metodo de las funciones generadoras de momento para demostrar que 2 Y/8 es una cantidad 
pivote y tiene una distribucion x 2 con 2 grados de libertad. 
b Use la cantidad pivote 2 Y/8 para deducir un intervalo de confianza de 90% para 8. 
c Compare el intervalo que obtuvo en el inciso b con el intervalo obtenido en el Ejemplo 8.4. 

8.47 Consulte el Ejercicio 8.46. Suponga que Y 1 ,Y 1 ., Y n es una muestra de tamano n para una distribucion 
exponential con media 8. 

a Utilice el metodo de las funciones generadoras de momento para demostrar que 2 Y^= i es una 
cantidad pivote y tiene una distribucion x 2 c °n 2 n grados de libertad. 
b Use la cantidad pivote 2 Xa=i ^ /0 para deducir un intervalo de confianza de 95% para 8. 
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8.48 

8.49 


8.6 


EJEMPLO 8.6 

Solucion 


c Si una muestra de tamano n = 7 da y = 4.77, use el resultado del inciso b para dar un intervalo de 
confianza de 95% para 6. 

Consulte los Ejercicios 8.39 y 8.47. Suponga que ■ ■ ■ , Y n es una muestra de tamano n de una 
poblacion con distribution gamma con a = 2 y [3 desconocida. 

a Utilice el metodo de las funciones generadoras de momento para demostrar que 2 1) IP es una 

cantidad pivote y tiene una distribution x 2 con 4n grados de libertad. 
b Use la cantidad pivote 2 K //3 para deducir un intervalo de confianza de 95% para f). 
c Si una muestra de tamano n = 5 da y = 5.39, use el resultado del inciso b para dar un intervalo de 
confianza para /3. 

Consulte el Ejercicio 8.48. Suponga que Y v Y 2 , . . . , Y n es una muestra de tamano n de una poblacion 
con distribution gamma con parametros a y /3. 

a Si a = m, donde m es un entero conocido y (3 es una incognita, encuentre una cantidad pivote que 
tenga una distribucion x 2 con m X n grados de libertad. Use esta cantidad pivote para deducir un 
intervalo de confianza de 100(1 - a)% para /3. 

b Si a = c, donde c es una constante conocida pero no un entero y [3 es una incognita, encuentre una 
cantidad pivote que tenga una distribucion gamma con parametros a* = cn y (8* = 1. De una formula 
para un intervalo de confianza 100(1 - a)% para fi. 

c Ejercicio Applet Consulte el inciso b. Si a = c = 2.57 y una muestra de tamano n = 10 da y = 
11.36, de un intervalo de confianza de 95% para /3. [Use la aplicacion Gamma Probabilities and 
Quantiles para obtener cuantiles apropiados para la cantidad pivote que obtuvo en el inciso b.] 


Intervalos de confianza en una muestra grande 

En la Section 8.3 presentamos algunos estimadores puntuales insesgados para los parametros 
fjL,p, n x — /j, 2 , y Pj - Pt Como indicamos en esa section, para muestras grandes todos estos es¬ 
timadores puntuales tienen distribuciones muestrales aproximadamente normales con errores 
estandar como los que se dan en laTabla 8.1. Esto es, dadas las condiciones de la Section 8.3, 
si el parametro objetivo 9 es /u, p, p , - p 2 , o - p 2 , entonces para muestras grandes. 


posee aproximadamente una distribucion normal estandar. En consecuencia, Z = (9 — 9)/<r§ 
forma (al menos aproximadamente) una cantidad pivote y el metodo del pivote se puede em- 
plear para desarrollar intervalos de confianza para el parametro objetivo 6. 


Sea 0 un estadistico que esta normalmente distribuido con media 6 y error estandar cr§- Encuentre 
un intervalo de confianza para 6 que posea un coeficiente de confianza igual a (1 - a). 

La cantidad 

6-0 

Z = - 

°9 

tiene una distribucion normal estandar. Ahora seleccione dos valores de las colas de esta dis¬ 
tribucion, z a / 2 y -z a / 2 , tales que (vea Figura 8.7) 


P(~z a /2 =£ Z < z/ai) = 1 - a. 
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Sustituyendo por Z en el enunciado de probabilidad, tenemos 

/ 0-0 \ 

P -Za /2 ' Z a l 2 1=1 ~ OL- 

Multiplicando por cr§, obtenemos 

P{-Z a /2(Jg < 0 - 0 < Zafl<J§) = 1 ~ OL 
y restando 0 de cada termino de la desigualdad, obtenemos 

P(~0 ~ Za/2<Jg < -0 < -0 + Za/lO-g) = 1 ~ OL. 


Por ultimo, multiplicando cada termino por -1 y, en consecuencia, cambiando la direction de 
las desigualdades, tenemos 

P(0 ~ Zc/2(Tg < 0 < 0 + Za/lCTg) = 1 ~ a. 


Entonces, los puntos extremos para un intervalo de confianza de 100(1- a)% para 0 estan 
dados por 

Ol = 6 — Za/ 20 fl y 0£/ = 0 + Z a / 2 &g- g 


Por medio de argumentos analogos podemos determinar que lfmites de confianza unilate- 
rales de 100(1 - a)%, a menudo llamados lfmites superior e inferior, respectivamente, estan 
dados por 

lfmite inferior al 100( 1 - a)% para 0=0- z a og 

lfmite superior al 100(1 - a)% para 0=0 + ZaVg 

Suponga que calculamos un lfmite inferior al 100(1 - a)% y un lfmite superior al 100(1 - 
a)% para 0. Entonces decidimos usarlos para formar un intervalo de confianza para 0. ^Cual 
sera el coeficiente de confianza de este intervalo? Una rapida mirada a lo anterior confirma 
que combinar lfmites inferior y superior, cada uno con coeficiente de confianza 1 - a, genera 
un intervalo bilateral con coeficiente de confianza de 1 - 2a. 

De acuerdo con las condiciones descritas en la Seccion 8.3, los resultados obtenidos en esta 
seccion se pueden usar para hallar intervalos de confianza de una muestra grande (unilateral 
o bilateral) para ji, p, (p. i - jj, 2 ), y (p, - p 2 ). Los siguientes ejemplos ilustran aplicaciones del 
metodo general desarrollado en el Ejemplo 8.6. 


EJEMPLO 8.7 Se registraron los tiempos de compra de n = 64 clientes seleccionados al azar en un super- 
mercado local. El promedio y varianza de los 64 tiempos de compra fueron 33 minutos y 256 
minutos 2 , respectivamente. Estime /+, el verdadero promedio de tiempo de compra por cliente, 
con un coeficiente de confianza de 1 - a = .90. 
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Solucion En este caso estamos interesados en el parametro f) = /jl. Entonces, 6 = y = 33 y s 2 = 256 
para una muestra de n = 64 tiempos de compra. La varianza poblacional cr 2 es desconocida, 
de modo que (como en la Seccion 8.3) usamos s 2 como su valor estimado. El intervalo de 
confianza 

0 ± Za/ 20g 


tiene la forma 


y ± Za/2 



~ y ± Za/2 



De la Tabla 4, Apendice 3, z a / 2 = z 05 = 1.645; por tanto, los limites de confianza estan 
dados por 

y_z " /2 (^) = 33_l ' 645 (^) = 2971 ’ 
y+ ^(^) = 33+l ' 645 (y) = 3629 ' 

Asf, nuestro intervalo de confianza para /jl es (29.71, 36.29). En muestreo repetido, aproxima- 
damente 90% de todos los intervalos de la forma Y ± 1 ,645(S/\/n) incluyen /jl, el tiempo me¬ 
dio real de compra por cliente. Aun cuando no sabemos si el intervalo particular (29.71, 36.29) 
contiene a /jl, el procedimiento que lo genero proporciona intervalos que captan la media real 
en aproximadamente 95% de todos los ejemplos en los que se utilice el procedimiento. ■ 


EJEMPLO 8.8 Dos marcas de refrigeradores, denotadas por A y B, estan garantizadas por 1 ano. En una 
muestra aleatoria de 50 refrigeradores de la marca A, se observo que 12 de ellos fallaron antes 
de terminar el periodo de garantia. Una muestra aleatoria independiente de 60 refrigeradores 
de la marca B tambien revelo 12 fallas durante el periodo de garantia. Calcule la diferencia 
real (p x -p 2 ) entre las proporciones de fallas durante el periodo de garantia, con un coeficiente 
de confianza de aproximadamente .98. 


Solucion El intervalo de confianza 


tiene ahora la forma 


6 ± 


Za/ 2^0 


(p 1 - h) ± Za/2 


pm 

n i 


P2(/2 
n 2 


Debido a que p v c/ v p 2 y q 2 son desconocidos, el valor exacto de og no se puede evaluar. Pero, 
como se indica en la Seccion 8.3, podemos obtener una buena aproximacion para og al susti- 
tuir pi, q\ = 1 — pi, p 2 y qi = 1 — pi por p x , q x , p 2 y q 2 , respectivamente. 

Para este ejemplo, p x = .24, q x = .76, pi = .20, q 2 = .80 y Z m = 2.33. El intervalo de 
confianza de 98% deseado es 


(.24 - .20) ± 2.33 


.04 ± .1851 


(■ 24)(.76) | (.20)(. 80) 
50 60 

o [-.1451, .2251], 
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Observe que este intervalo de confianza incluye al cero. Entonces, un valor cero para la diferencia 
en proporciones (p l - p 2 ) es “crefble” (con un nivel de confianza aproximado de 98%) con base 
en los datos observados. No obstante, el intervalo tambien incluye el valor .1. Por tanto, .1 re- 
presenta otro valor de (p, - p 2 ) que es “crefble” con base en los datos que hemos analizado. 


Cerramos esta seccion con una investigacion practica de la aplicacion del procedimiento de 
estimacion de intervalos de una muestra grande para una sola proporcion poblacional p, con 
base en Y, el numero de exitos observado durante n intentos en un experimento binomial. En 
este caso, 6 =p;6=p = Y/nyo§ = up = V p( 1 — p)/n ~ y/p(l — P)/ n - (Al igual 
que en la Seccion 8.3, V/H 1 — P)/ n da una buena aproximacion para <r- p .) Los lfmites de 
confianza apropiados son entonces 


Ol = P - Za/2 


P(l-P) 


y 6jj= p + Za /2 


p(l-p) 


La figura 8.8 muestra los resultados de 24 experimentos binomiales independientes, cada 
uno basado en 35 intentos cuando el verdadero valor de p es = 0.5. Para cada uno de los ex¬ 
perimentos calculamos el numero de exitos y, el valor de p = y /35 y el correspondiente in¬ 
tervalo de confianza de 95% usando la formula p ± 1.96 y/p(l — p)/ 35. (Observe que z 025 
= 1.96.) En el primer experimento binomial vimos que y = 18, p = 18/35 = 0.5143 y 
up ~ \/p{ 1 — p)/n = V(-5143)(.4857)/35 = 0.0845.. Por tanto, el intervalo obtenido en 
el primer experimento es .5143 ± 1.96(0.0845) o (0.3487, 0.6799). La estimacion para p 
desde el primer experimento es mostrada por el punto grande mas bajo de la Figura 8.8 y 
el intervalo de confianza resultante esta dado por la recta horizontal que pasa por ese punto. 
La recta vertical indica el verdadero valor de p, 0.5 en este caso. Observe que el intervalo 


FIGURA 8.8 
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obtenido en el primer intento (de tamano 35) en realidad contiene el valor verdadero de la 
proportion poblacional p. 

Los 23 intervalos de confianza restantes contenidos en esta pequena simulation estan dados 
por el resto de las lineas horizontales de la Figura 8.8. Observe que cada intervalo individual 
contiene o no el valor verdadero de p. No obstante, el valor verdadero de p esta contenido en 
23 de los 24 intervalos (95.8%) observados. 

Si se utilizara muchas veces el mismo procedimiento, cada intervalo individual contendrfa 
o no el valor verdadero de p, pero el porcentaje de todos los intervalos que capturan p serfa 
muy cercano a 95%. Uno tiene “95% de confianza” de que el intervalo contenga el parametro 
ya que este se obtuvo usando un procedimiento que genera intervalos que contienen el para¬ 
metro aproximadamente 95% de las veces que se usa. 

La aplicacion ConfidencelntervalP (disponible en www.thomsonedu.com/statistics/wac- 
kerly) fue utilizada para generar la Figura 8.8. /.Que ocurre si se usan diferentes valores de n o 
diferentes coeficientes de confianza? ^Obtenemos resultados similares si el valor verdadero de 
p es otro diferente de 0.5? Varios de los siguientes ejercicios nos permitiran usar la aplicacion 
para contestar preguntas como estas. 

En esta seccion hemos empleado el metodo del pivote para deducir intervalos de confianza 
de una muestra grande para los parametros p, p, p , - p 2 y p , - p 2 de acuerdo con las condi- 
ciones de la Seccion 8.3. La formula basica es 




donde los valores de Q y og aparecen en la Tabla 8.1. Cuando 0 = p es el parametro objetivo, 
entonces 0 = Y y cr? = cr 2 /n, donde cr 2 es la varianza poblacional. Si se conoce el valor 
verdadero de cr 2 , debe usarse en el calculo del intervalo de confianza; si a 2 no se conoce y n 
es grande, no hay demasiada perdida de precision si s 2 se sustituye por cr 2 en la formula del 
intervalo de confianza. Del mismo modo, si erf y cr 2 son desconocidas y tanto n i como n n son 
grandes, s 2 y s\ se pueden sustituir por estos valores en la formula del intervalo de confianza 
de una muestra grande para 0 = p ; — p 2 . 

Cuando 6 = p es el parametro objetivo, entonces § = p y crp = V pq/n. Como p es el 
parametro objetivo desconocido, a- p no puede ser evaluada. Si n es grande y sustituimos 
P por p (y q = 1 — p por q) en la formula para up; sin embargo, el intervalo de confianza 
resultante tendra aproximadamente el coeficiente de confianza establecido. Para n, y n n 
grandes, se cumplen enunciados semejantes cuando p\ y p 2 se usan para calcular p l y p 2 , 
respectivamente, en la formula para erf La justificacion teorica para estas sustituciones 
se dara en la Seccion 9.3. 


Ejercicios 

8.50 Consulte el Ejemplo 8.8. En este ejemplo, p l y p 2 se usaron para denotar las proporciones de refrigera- 
dores de las marcas A y B, respectivamente, que fallaron durante los perfodos de garantfa. 

a En el nivel aproximado de 98% de confianza, ^,cual es el mayor “valor crefble” para la diferencia en 
las proporciones de fallas de refrigeradores de las marcas A y B? 

b En el nivel aproximado de 98% de confianza, ^,cual es el menor “valor crefble” para la diferencia en 
las proporciones de fallas de refrigeradores de las marcas A y B? 
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c Si p 1 - p-, es realmente igual a 0.2251, ^cual marca tiene la mayor proporcion de fallas durante el 
periodo de garantra? ^Que tan to mas grande? 

d Si Pj - p 2 es realmente igual a -0.1451, ),cual marca tiene la mayor proporcion de fallas durante el 
periodo de garantra? i,Que tanto mas grande? 

e Como se observo en el Ejemplo 8.8, cero es un valor crerble de la diferencia. ^Concluiria usted que 
hay evidencia de una diferencia en las proporciones de fallas (dentro del periodo de garantra) para las 
dos marcas de refrigeradores? ^Por que? 


8.51 Ejercicio Applet ^Que ocurre si tratamos de usar la aplicacion ConfidencelntervalP (disponible en 
www.thomsonedu.com/statistics/wackerly) para reproducir los resultados presentados en la Figura 8.8? 
Entre en la aplicacion. No cambie el valor de p de .50 o el coeficiente de confianza de .95, pero use el 
boton “Sample Size” para cambiar el tamano muestral an — 35. Haga clic en el boton “One Sample” 
una sola vez. En la parte superior izquierda de la pantalla, los valores de la muestra estan descritos por 
un conjunto de 35 ceros (0) y unos (1), y el valor de la estimacion para p y el intervalo de confianza 
resultante de 95% se dan debajo de los valores de muestra. 

a ),Cual es el valor de p que obtuvo? ),Es igual que el primer valor obtenido, 0.5143, cuando la Figura 
8.8 se genero? ),Le sorprende esto? ),Por que? 

b Use el valor de la estimacion que obtuvo y la formula para un intervalo de confianza de 95% para 
verificar que el intervalo de confianza dado en la pantalla este correctamente calculado. 
c ),E1 intervalo que usted obtuvo contiene el valor verdadero de pi 

d ),Cual es la longitud del intervalo de confianza que usted obtuvo? ),Es exactamente igual que la lon- 
gitud del primer intervalo, (.3487, .6799), obtenida cuando se genero la Figura 8.8? (,Por que? 
e Haga clic en el boton “One Sample” otra vez. ),Este intervalo es diferente que el previamente 
generado? Haga clic en el boton “One Sample” tres veces mas. ^Cuantos intervalos claramente 
diferentes aparecen entre los primeros 5 intervalos generados? ),Cuantos de ellos contienen .5? 
f Haga clic en el boton “One Sample” hasta que haya obtenido 24 intervalos. ^Que porcentaje de los 
intervalos contiene el valor verdadero de p = .51 ),E1 porcentaje es cercano al valor que usted espe- 
raba? 


8.52 Ejercicio Applet Consulte el Ejercicio 8.51. No cambie el valor de p de .50 o el coeficiente de confianza 
de .95, pero use el boton “Sample Size” para cambiar el tamano muestral a n = 50. Haga clic en el boton 
“One Sample” una sola vez. 

a ^Que tan largo es el intervalo de confianza resultante? ),C6mo se compara la longitud del intervalo 
con la que obtuvo en el Ejercicio 8.51(d)? ),Por que son diferentes las longitudes de los intervalos? 
b Haga clic en el boton “25 Samples”. ),E1 porcentaje de intervalos que contiene el valor verdadero de 
p es cercano a lo que usted esperaba? 

c Haga clic en el boton “100 Samples”. ^El porcentaje de intervalos que contiene el valor verdadero de 
p es cercano a lo que usted esperaba? 

d Si usted hiciera clic varias veces en el boton “100 Samples” y calculara el porcentaje de todos los 
intervalos que contienen el valor verdadero de p, ),que porcentaje de intervalos espera que contengan 
pi 

8.53 Ejercicio Applet Consulte los Ejercicios 8.51 y 8.52. Cambie el valor de p a .25 (ponga el cursor en la 
lrnea vertical y arrastrelo a la izquierda hasta que aparezca .25 como la probabilidad verdadera). Cambie 
el tamano muestral a n = 75 y el coeficiente de confianza a 0.90. 
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a Haga clic en el boton “One Sample” una vez. 

i ^Cual es la longitud del intervalo resultante? ^E1 intervalo es mas largo o mas corto que el obtenido 
en el Ejercicio 8.51(d)? 

ii Mencione tres razones por las que el intervalo que obtuvo usted en el inciso (i) es mas corto que el 
intervalo obtenido en el Ejercicio 8.51(d). 

b Haga clic en el boton “100 Samples” unas cuantas veces. Cada clic producira 100 intervalos y dara 
al usuario el numero y proporcion de esos 100 intervalos que contienen el valor verdadero de p. 
Despues de cada clic anote el numero de intervalos que contienen p = .25. 

i ^Cuantos intervalos genera? ^Cuantos de estos intervalos contienen el verdadero valor de p? 

ii ^Que porcentaje de todos los intervalos contienen a pi 

8.54 Ejercicio Applet Consulte los Ejercicios 8-51-8.53. Cambie el valor de p a .90. Cambie el tamano 
muestral a n = 10 y el coeficiente de confianza a 0.95. Haga clic en el boton “100 Samples” unas cuantas 
veces. Despues de cada clic anote el numero de intervalos que contienen p = .90. 

a Cuando la simulation produjo diez exitos en diez intentos, ^cual es el intervalo de confianza resultan¬ 
te de 95% parap? ^Cual es la longitud del intervalo? ^Por que? ^Corno se representa en la pantalla? 

b ^Cuantos intervalos genero? ^Cuantos de los intervalos generados contienen el valor verdadero 
de p? 

c ^Que porcentaje de todos los intervalos generados contienen a p? 
d /,Le sorprende el resultado del inciso c? 

e ^E1 resultado del inciso c invalida los procedimientos del intervalo de confianza de muestra grande 
presentados en esta section? ^Por que? 

8.55 Ejercicio Applet Consulte los Ejercicios 8.51-8.54. Cambie el valor dep a .90. Cambie el tamano muestral a 
n = 100 y el coeficiente de confianza a .95. Haga clic en el boton "100 Samples” unas cuantas veces. Despues 
de cada clic anote el numero de intervalos que contienen p = .90 y conteste las preguntas planteadas en el 
Ejercicio 8.54, incisos b-e. 

8.56 ^Esta menguando el romance de los estadounidenses con el cine? En una encuesta Gallup 5 de n = 800 
adultos seleccionados aleatoriamente, 45% indicaron que el cine estaba mejorando mientras que 43% 
dijeron que el cine estaba empeorando. 

a Encuentre un intervalo de confianza de 98% para p, la proporcion total de adultos que dicen que el 
cine esta mejorando. 

b /,E1 intervalo incluye el valor p = 0.50? ^Piensa usted que una mayorfa de adultos dice que el cine 
esta mejorando? 

8.57 Consulte el Ejercicio 8.29. De acuerdo con el resultado dado ahf, 51% de los n — 1001 adultos encues- 
tados en noviembre de 2003 dijeron ser aficionados al beisbol. Construya un intervalo de confianza de 
99% para la proporcion de adultos que en noviembre de 2003 dijeron ser aficionados al beisbol (despues 
de la Serie Mundial). Interprete este intervalo. 

8.58 Los administradores de un hospital deseaban estimar el numero promedio de dfas necesarios para el 
tratamiento de enfermos internados entre las edades de 25 y 34 anos. Una muestra aleatoria de 500 
pacientes entre estas edades produjo una media y una desviacion estandar igual a 5.4 y 3.1 dfas, respec- 
tivamente. 


5 Fuente: “Movie Mania Ebbing,” Gallup Poll of 800 adults, http://www.usatoday.com/snapshot/news/2001-06- 
14-moviemania.htm., 16-18 de marzo de 2001 
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Construya un intervalo de confianza del 95% para la duration media de permanencia de la poblacion de 
pacientes de la cual se extrajo la muestra. 

8.59 Cuando se trata de anunciar, los “preadolescentes” no estan listos para mensajes de lfnea dura que pu- 
blicistas usan con frecuencia para llegar a los adolescentes. El estudio 6 del grupo Geppeto encontro que 
78% de los “preadolescentes” entienden y disfrutan anuncios que son tontos por naturaleza. Suponga 
que el estudio comprendio n = 1030 “preadolescentes”. 

a Construya un intervalo de confianza de 90% para la proportion de “preadolescentes” que entienden 
y disfrutan anuncios que son tontos por naturaleza. 

b ^Piensa usted que “mas de 75%” de todos los “preadolescentes” disfrutan anuncios que son tontos 
por naturaleza? ^Por que? 

8.60 ^Cual es la temperatura corporal normal para personas sanas? Una muestra aleatoria de 130 temperatu- 
ras corporales en personas sanas proporcionadas por Allen Shoemaker 7 dio 98.25 grados y desviacion 
estandar de 0.73 grados. 

a De un intervalo de confianza de 99% para el promedio de temperatura corporal de personas sanas. 
b El intervalo de confianza obtenido en el inciso a ^contiene el valor de 98.6 grados, que es el promedio 
aceptado de temperatura citado por medicos y otros? ^Que puede usted concluir? 

8.61 Una pequena cantidad selenio, de 50 a 200 microgramos (/xg) por dfa, es considerada esencial para una 
buena salud. Suponga que se seleccionaron muestras aleatorias independientes, de n l = n 2 = 30 adultos 
provenientes de dos regiones de Estados Unidos y que se registro para cada persona una ingesta diaria 
de selenio tanto de llquidos corno de solidos. La media y la desviacion estandar de la ingesta diaria de 
selenio para los 30 adultos de la region 1 fueron y = 167.1 /xg y s 2 = 24.3 /xg, respectivamente. Los 
estadlsticos correspondientes para los 30 adultos de la region 2 fueron y = 140.9 /xg y s 2 — 17.6 /xg. 
Encuentre un intervalo de confianza de 95% para la diferencia en la ingesta media de selenio para las 
dos regiones. 

8.62 Los siguientes estadlsticos son el resultado de un experimento realizado por P. I. Ward para investigar 
una teorla relativa al comportamiento de cambio de piel del macho Gammarus pulex, un pequeno crus- 
taceo. 8 Si el macho cambia de piel mientras se aparea con una hembra, este debe liberarla y perderla. 
La teorla es que el macho Gammarux pulex es capaz de posponer dicho cambio, con lo cual reduce la 
posibilidad de perder su pareja. Ward asigno aleatoriamente 100 parejas de machos y hembras a dos gru- 
pos de 50 cada uno. Las parejas del primer grupo se mantuvieron juntas (normal); las del segundo grupo 
fueron separadas. Se registro el tiempo de muda para machos y hembras, y las medias, desviaciones 
estandar y tamanos muestrales se ilustran en la tabla siguiente. (El ntimero de crustaceos en cada una de 
las cuatro muestras es menor que 50 porque algunos en cada grupo no sobrevivieron hasta el tiempo de 
muda.) 


Tiempo de muda (dlas) 



Media 

s 

n 

Machos 

Normal 

24.8 

7.1 

34 

Separados 

21.3 

8.1 

41 

Hembras 

Normal 

8.6 

4.8 

45 

Separados 

11.6 

5.6 

48 


6. Fuente: “Caught in the Middle”, American Demographics, julio de 2001. pp. 14-15. 

7. Fuente: Allen L. Shoemaker, “What’s Normal? Temperature, Gender and Heart Rate,” Journal of Statistics Edu¬ 
cation (1966). 

8. Fuente: “Gammarus pulex Control Their Moult Timing to Secure Mates,” Animal Behaviour 32 (1984). 
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a Encuentre un intervalo de confianza de 99% para la diferencia en tiempo promedio de muda para 
machos “normales” contra los “separados” de sus parejas. 
b Interprete el intervalo. 

8.63 A la mayorfa de estadounidenses les gusta participar eventos deportivos o al menos verlos. Algunos 
sienten que los deportes tienen mas que solo valor de entretenimiento. En una encuesta de 1000 adultos, 
realizada por KRC Research & Consulting, 78% sinderon que los deportes de gran atractivo tienen un 
efecto positivo en la sociedad.'* 

a Encuentre un intervalo de condanza de 95% para el porcentaje del publico que piensa que los depor¬ 
tes tienen un efecto positivo en la sociedad. 

b La encuesta publico un margen de error de “mas o menos 3.1%”. ^Esto concuerda con la respuesta 
de usted al inciso a? ^Que valor de p produce el margen de error dado por la encuesta? 

8.64 En una encuesta de la CNN/ USA Today/Ga\\wp a 1000 estadounidenses se les pregunto que tan bien 
los describla el termino patridtico. 10 Algunos resultados de la encuesta estan contenidos en la siguiente 
tabla de resumen. 


Grupo de edad 



Todos 

18-34 

60+ 

Muy bien 

.53 

.35 

.77 

Regular 

.31 

.41 

.17 

No muy bien 

.10 

.16 

.04 

Nada bien 

.06 

.08 

.02 


a Si los grupos de 18-34 y 60 o mas anos estaban formados de 340 y 150 individuos, respectivamente, 
encuentre un intervalo de confianza de 98% para la diferencia en proporciones de los individuos en 
estos grupos de edades que acordaron que patridtico los describla muy bien. 
b Con base en el intervalo que obtuvo en el inciso a, ^piensa que la diferencia en proporciones de los 
que se vieron a si mismos como patrioticos es de hasta 0.6? Explique. 

8.65 Para una comparacion de los porcentajes de piezas defectuosas producidas por dos llneas de montaje, 
de cada llnea se seleccionaron muestras aleatorias independientes de 100 piezas. La llnea A produjo 18 
piezas defectuosas en la muestra y la llnea B contenla 12 piezas defectuosas. 

a Encuentre un intervalo de confianza de 98% para la verdadera diferencia en proporciones de piezas 
defectuosas para las dos llneas. 

b iHay evidencia aqul que sugiera que una llnea produce una proportion mas alta de piezas defectuo¬ 
sas que la otra? 

8.66 Historicamente, la biologla se ha impartido en conferencias y la evaluation de su aprendizaje se logro 
mediante pruebas de vocabulario y datos memorizados. Un nuevo currlculo inventado por un profesor: 
Biologla, contenido de una comunidad (BACC, por sus siglas en ingles), esta basado en estandares, 
orientado a actividades y centrado en preguntas. Los estudiantes a quienes se enseno a usar los meto- 
dos historicos y los nuevos fueron examinados, en el sentido traditional, sobre conceptos de biologla 
que destacaban conocimientos de biologla y habilidades en procesos. Los resultados de un examen 
sobre conceptos de biologla se publicaron en The American Biology Teacher y se muestran en la tabla 
siguiente. 11 


9. Fuente: Mike Tharp, “Ready, Set, Go. Why We Love Our Games—Sports Crazy,” U.S. News & World Report, 15 
de julio de 1997, p. 31. 

10. Fuente: Adaptado de “I’am a Yankee Doodle Dandy,” Kowledge Networks: 2000, American Demographics, julio 
de 2001, P- 9. 

11. Fuente: William Leonard, Barbara Speziale. y John Pernick, "Performance Assessment of a Standards-Based 
High School Biology Curriculum." The American Biology Teacher 63(5) (2001 ):310-316. 
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Estimacion 



Media 

Tamano 

muestral 

Desviacion 

estandar 

Pre-examen: todos los grupos BACC 

13.38 

372 

5.59 

Pre-examen: todo tradicional 

14.06 

368 

5.45 

Post-examen: todos los grupos BACC 

18.50 

365 

8.03 

Post-examen: todo tradicional 

16.50 

298 

6.96 


a Proponga un intervalo de confianza de 90% para la calificacion media de postexamen para todos los 
estudiantes BACC. 

b Encuentre un intervalo de confianza de 95% para la diferencia en las calificaciones medias de post¬ 
examen para estudiantes BACC y los que aprendieron en forma tradicional. 
c ^El intervalo de confianza del inciso b proporciona evidencia de que hay una diferencia en las califi¬ 
caciones medias postexamen para estudiantes BACC y los tradicionales? Explique. 

8.67 Un metodo sugerido para resolver la escasez de energfa electrica en una region comprende la construe- 
cion de plantas nucleares flotantes generadoras de energfa electrica a pocas millas de la costa en el ocea- 
no. La preocupacion por la posibilidad de una colision de barcos con la planta flotante, pero anclada, ha 
aumentado la necesidad de una estimacion de la densidad del transito de barcos en la zona. El numero 
de barcos que pasan diariamente a no mas de 10 millas de la ubicacion propuesta de la planta electrica, 
registrada para n = 60 dfas durante julio y agosto, posefa una media muestral y varianza de y = 7.2 y 
s 2 = 8.8. 

a Encuentre un intervalo de confianza de 95% para el numero medio de barcos que pasen a no mas de 
10 millas del lugar propuesto para la planta electrica durante un perfodo de 1 dfa. 
b Se esperaba que la densidad de transito disminuyera durante los meses de invierno. Una muestra de n 
= 90 registros diarios de avistamientos de barcos para diciembre, enero y febrero dieron una media 
y varianza de y = 4.7 y s 2 = 4.9. Encuentre un intervalo de confianza de 90% para la diferencia en 
la densidad promedio de transito de barcos entre los meses de verano e invierno. 
c ^Cual es la poblacion asociada con la estimacion en el inciso b? ^Que podria estar mal con el proce- 
dimiento de muestreo para los incisos a y b? 

*8.68 Suponga que Ej, Y 2 , Y 3 y Y 4 tienen una distribucion multinomial con n intentos y probabilidades p v p 2 , 
p 3 y Pa P ara l as cuatro celdas. A1 igual que en el caso binomial, cualquier combinacion lineal de Ej, Y 2 , 
Y 3 y Y 4 estara distribuida normalmente en forma aproximada para n grande. 

a Determine la varianza de Y l - K,. [Sugerencia: recuerde que las variables aleatorias Ej son dependien- 
tes.] 

b Un estudio de actitudes entre residentes de Florida con respecto a polfticas para manejar la presencia 
de caimanes en zonas urbanas mostro lo siguiente. Entre 500 personas muestreadas y a las que se les 
dieron cuatro opciones de manejo, 6% dijeron que los caimanes deberfan ser protegidos por comple¬ 
te, 16% dijeron que deberfan ser destruidos por guardias de fauna silvestre, 52% dijeron que deberfan 
ser reubicados vivos y 26% dijeron que deberfa permitirse una cosecha comercial regulada. Calcule 
la diferencia entre la proportion de la poblacion que esta a favor de la completa protection y la que 
esta en pro de la destruction por guardias de fauna silvestre. Use un coeficiente de confianza de .95. 

8.69 El Journal of Communication, invierno de 1978, publico un estudio acerca de ver violencia en TV. 
Muestras de poblaciones con bajos porcentajes de ver television (10-19 programas por semana) 
y altos porcentajes de verla (40-49 programas por semana) se dividieron en dos grupos de edades y 
se registro el numero Y de personas que ven un alto numero de programas de violencia. Los datos 
para dos grupos de edades se muestran en la tabla siguiente, con n t denotando el tamano muestral para 
cada celda. Si fj, Y 2 , Y 3 y Y 4 tienen distribuciones binomiales independientes con parametros p v p-,. 
Pi y Pa> respectivamente, encuentre un intervalo de confianza de 95% para (p 3 - pf — (p 4 — pf). Esta 
funcion de los valores p l representa una comparacion entre el cambio en los habitos de ver TV para 
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adultos jovenes y el cambio correspondiente para adultos mayores, cuando pasamos de los que tienen 
bajo porcentaje de ver TV a aquellos que tienen altos porcentajes de verla. (Los datos sugieren que el 
porcentaje de ver violencia puede aumentar con adultos jovenes pero disminuye con adultos mayores.) 


Porcentaje 


Grupo de edad 


de ver TV 


16-34 

55 y mas 


Bajo 

yi 

= 20 m = 31 

y 2 = 13 n 2 

= 30 

Alto 

T3 

= 18 n 3 = 26 

y 4 = 7 n 4 

= 28 


8.7 Seleccion del tamano muestral 

El diseno de un experimento es en esencia un plan para adquirir una cantidad de informacion. 
A1 igual que cualquier otra mercancfa, la informacion se puede comprar a precios que varfan 
dependiendo de la forma en la que se obtienen los datos. Algunas mediciones contienen una 
gran cantidad de informacion acerca del parametro de interes; otras pueden contener poca o 
ninguna. La investigacion, ya sea cientffica o de otro tipo, se hace para obtener informacion. 
Obviamente, deberfamos buscar obtener informacion a un costo mmirno. 

El procedimiento de muestreo, o diseno experimental, como suele llamarse, afecta la canti¬ 
dad de informacion por medicion. Este, junto con el tamano muestral n controla la cantidad to¬ 
tal de informacion relevante en una muestra. En esta etapa de nuestro estudio nos ocuparemos 
de la situation de muestreo mas sencilla: muestreo aleatorio de una poblacion relativamente 
grande. Primero dedicamos nuestra atencion a la seleccion del tamano muestral n. 

Un investigador avanza poco en la planeacion de un experimento antes de abordar el 
problema de seleccionar el tamano muestral. De hecho, una de las preguntas mas frecuen- 
tes que se plantea un estadfstico es (cuantas mediciones deben incluirse en la muestra? 
Desafortunadamente, el estadfstico no puede contestar esta pregunta sin saber cuanta infor¬ 
macion desea obtener el experimentador. Si nos referimos especfficamente a una estimacion, 
nos gustarfa saber que tan precisa desea el experimentador que sea. El experimentador puede 
indicar la precision deseada al especificar un lfmite en el error de estimacion. 

Por ejemplo, suponga que deseamos estimar el promedio diario de production p, de un 
producto qufmico y deseamos que el error de estimacion sea menor que 5 toneladas con pro- 
babilidad de .95. Debido a que aproximadamente 95% de las medias muestrales estaran a no 
mas de 2<jy de p en muestreo repetido, estamos pidiendo que 2cry sea igual a 5 toneladas (vea 
la Figura 8.9). Entonces 


2(7 



4(7“ 

"25"' 


No podemos obtener un valor numerico exacto para n a menos que se conozca la desviacion 
estandar poblacional cr. Esto es exactamente lo que esperarfamos porque la variabilidad aso- 
ciada con el estimador Y depende de la variabilidad exhibida en la poblacion de la cual se 
saco la muestra. 

A falta de un valor exacto para cr, usamos la mejor aproximacion disponible, por ejemplo 
una estimacion s obtenida de una muestra previa, o el conocimiento de la amplitud de las 
mediciones en la poblacion. Como la amplitud es aproximadamente igual a 4cr (recuerde la 
regia empfrica), un cuarto de la amplitud da un valor aproximado de cr. Para nuestro ejemplo 
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suponga que se sabe que la amplitud de la produccion es aproximadamente de 84 toneladas. 
Entonces cr ~ 84/4= 21 y 


_ 4<t 2 
~ ~25~ 
= 71. 


(4)(21 ) 2 
25 


70.56 


Usando un tamano muestral n = 71, podemos tener cierta seguridad (con un coeficiente de 
confianza de alrededor de .95) de que nuestro calculo se encuentra a no mas de 5 toneladas del 
verdadero promedio diario de produccion. 

En realidad, esperariamos que el error de estimacion fuera mucho menor que 5 toneladas. 
De acuerdo con la regia empirica, la probabilidad es aproximadamente igual a .68 de que el 
error de estimacion sea menor que ay = 2.5 toneladas. Las probabilidades .95 y .68 emplea- 
das en estos enunciados son inexactas porque a fue aproximada. Aun cuando este metodo 
de seleccionar el tamano muestral es solo aproximado para una precision especificada de 
estimacion, es el mejor del que se dispone y es ciertamente mejor que seleccionar el tamano 
muestral de manera intuitiva. 

El metodo de seleccionar los tamanos muestrales para todos los procedimientos de estima¬ 
cion de muestra grande indicados en la Tabla 8.1 es analogo al que acabamos de describir. El 
experimentador debe especificar un limite deseado en el error de estimacion y un nivel de con¬ 
fianza asociado 1 - a. Por ejemplo, si el parametro es 9 y el limite deseado es B, igualamos 


Zaj2&0 B, 


donde, como en la Seccion 8.6, 

P(Z > Za/l) = y 

Ilustramos el uso de este metodo en los siguientes ejemplos. 


EJEMPLO 8.9 La reaccion de un individuo a un estimulo en un experimento psicologico puede tomar una de 
dos formas, A o B. Si un experimentador desea estimar la probabilidad p de que una persona 
reaccione en una forma A, ^cuantas personas deben incluirse en el experimento? Suponga que 
el experimentador estara satisfecho si el error de estimacion es menor que .04 con probabilidad 
igual a .90. Suponga tambien que el espera que p se encuentre en algun punto cercano a .6. 

Solucion Debido a que hemos especificado que 1 - a = .90, a debe ser igual a .10 y a/2 = .05. El 
valor z correspondiente a un area igual a .05 en la cola superior de la distribucion normal 
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estandar es z a / 2 = z ()5 = 1.645. Entonces requerimos que 


1.645(7,; 


.04, o 



Como el error estandar de P depende de p, que es desconocido, podrfamos usar el valor esti- 
mado de p = .6 dado por el experimentador como un valor aproximado para n. Entonces 


1.645 


(-6X.4) 

n 


= .04 


n = 406. 


En este ejemplo supusimos que p ~ .60. (j C6mo procederiamos si no tuvieramos idea del valor 
verdadero de pi En el Ejercicio 7.76(a) establecimos que el valor maximo para la varianza de 
p = Y/n se presenta cuando p = .5. Si no supieramos que p ~ .6, usarfamos p = .5, que daria 
el maximo valor posible para n: n = 423. No importa cual sea el verdadero valor de p, n = 
423 es lo suficientemente grande para dar una estimacion que este a no mas de B = .04 de p 
con probabilidad .90. ■ 


EJEMPLO 8.10 Un experimentador desea comparar la efectividad de dos metodos de capacitacion para obre- 
ros que van a realizar una operacion de ensamble. Los obreros seleccionados han de dividirse 
en dos grupos de igual tamano, el primero para recibir el metodo 1 de capacitacion y el segun- 
do el metodo 2 de capacitacion. Despues de la capacitacion cada obrero realizara la operacion 
de ensamble y se registrar^ el tiempo que le tome hacerlo. El experimentador espera que las 
mediciones para ambos grupos tengan una amplitud de aproximadamente 8 minutos. Si la 
estimacion de la diferencia en los tiempos promedio de ensamble debe ser correcta con una 
variacion de no mas de 1 minuto con probabilidad .95, ( ' cuantos trabajadores deben incluirse 
en cada grupo de capacitacion? 


Solucion El fabricante especifico 1 - a = .95. Entonces, a = .05 y z a / 2 = Z 025 = 1-96. Igualando 
1.96(7, v v , a 1 minuto, obtenemos 

Ul 1 2 ) 



De manera alternativa, como deseamos que n l sea igual a n 2 . podemos hacer n i = n 2 = n y 
obtener la ecuacion 



Como ya dijimos antes, la variabilidad de cada metodo de ensamble es aproximadamente 
igual; en consecuencia, (7p = of = a 2 . Debido a que la amplitud, 8 minutos, es aproximada¬ 
mente igual a 4(7, tenemos 


4(7 « 8, o bien, lo que es equivalente, cr ~ 2. 
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Sustituyendo este valor por cr x y cr 2 en la ecuacion anterior, obtenemos 



7 


n 


n 


8.70 


8.71 


8.72 


8.73 


8.74 


8.75 


Resolviendo, obtenemos n = 30.73. Por tanto, cada grupo debe contener n = 31 miembros. 


Ejercicios 


Sea Y una variable aleatoria binomial con parametro p. Encuentre el tamano muestral necesario para 
calcular p con tolerancia de no mas de .05 con probabilidad .95 en las siguientes situaciones: 

a Si se considera que p es aproximadamente .9. 

b Si no se conoce information acerca de p (use p = .5 para calcular la varianza de p). 

Un servicio estatal de fauna silvestre desea calcular el numero promedio de dras que cada cazador con 
licencia se dedica a esta actividad realmente durante una estacion determinada, con un limite en el error 
de estimacion igual a 2 dlas de caza. Si los datos recolectados en estudios anteriores han demostrado que 
cr es aproximadamente igual a 10, ^cuantos cazadores deben estar incluidos en el estudio? 

Es frecuente que encuestadores por telefono entrevisten entre 1000 y 1500 personas sobre sus opiniones 
en asuntos varios. ^E1 rendimiento de los equipos de atletismo universitarios dene un impacto positivo 
en la perception del publico del presdgio de las instituciones? Una nueva encuesta se va a efectuar para 
ver si hay diferencia entre las opiniones de hombres y mujeres sobre este asunto. 

a Si se han de entrevistar 1000 hombres y 1000 mujeres, (,con cuanta precision podna usted estimar la 
diferencia en las proporciones que piensan que el rendimiento de sus equipos de atletismo tiene un 
impacto positivo en la perception del publico acerca del presdgio de las instituciones? Encuentre un 
limite para el error de estimacion. 

b Supongamos que usted estuviera disenando la encuesta y desea estimar la diferencia en un par de 
proporciones, correcta a no mas de .02, con probabilidad .9. ^Cuantas entrevistas deben incluirse en 
cada muestra? 

Consulte el Ejercicio 8.59. ^Cuantos “preadolescentes” deben haber sido entrevistados para calcular 
la proportion de ellos que entienden y disfrutan de anuncios de naturaleza tonta, correcto a no mas de 
.02, con probabilidad 0.99? Use la proportion del ejemplo anterior para calcular el error estandar de la 
estimacion. 

Supongamos que usted desea calcular el pH promedio de precipitaciones en una zona que sufre de fuerte 
contamination debido a la descarga de humo de una planta de energfa electrica. Suponga que cr esta en 
las cercanfas de .5 pH y que se desea que el calculo varie en no mas de . 1 de p con probabilidad cercana 
a .95. ^Aproximadamente cuantas precipitaciones deben estar incluidas en la muestra (una lectura de 
pH por precipitation)? ^Serfa valido seleccionar todos las muestras de agua de una sola precipitation? 
Explique. 

Consulte el Ejercicio 8.74. Supongamos que usted desea calcular la diferencia entre la acidez media para 
lluvias en dos lugares diferentes, uno en una zona relativamente poco contaminada a lo largo del oceano 
y la otra en una region sometida a fuerte contamination del aire. Si se desea que el calculo sea correcto al 
.1 pH mas cercano con probabilidad cercana a .90, ^aproximadamente cuantas precipitaciones (valores 
de pH) deben incluirse en cada muestra? (Suponga que la varianza de las mediciones de pH es alrede- 
dor de .25 en ambos lugares y que las muestras han de ser del mismo tamano.) 


8.70 


8.71 


8.72 


8.73 


8.74 


8.75 
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8.76 Consulte la comparacion de la ingesta diaria de selenio para un adulto en dos diferentes regiones de 
Estados Unidos del Ejercicio 8.61. Suponga que se desea calcular la diferencia en la ingesta diaria pro- 
medio entre las dos regiones, con un error maximo de no mas de 5 /jl g, con probabilidad .90. Si se planea 
seleccionar un numero igual de adultos de las dos regiones (esto es, si yu,j = /jl 2 ), ^que tan grandes deben 
ser n l y n 2 ? 

8.77 Consulte el Ejercicio 8.28. Si el investigador desea calcular la diferencia en proporciones a no mas de 
.05 con 90% de confianza, ^cuantos egresados y no egresados deben ser entrevistados? (Suponga que 
sera entrevistado un numero igual de cada grupo.) 

8.78 Consulte el Ejercicio 8.65. ^Cuantas piezas deben muestrearse de cada lrnea si un intervalo de confianza 
de 95% para la diferencia real entre las proporciones ha de tener un ancho de .2? Suponga que muestras 
de igual tamano se tomaran de cada lfnea. 

8.79 Consulte el Ejercicio 8.66. 

a Se ha de emprender otro estudio semejante para comparer las calificaciones promedio de postexa- 
men para estudiantes de biologfa de secundaria BACC y los que aprenden de manera tradicional. El 
objetivo es producir un intervalo de confianza de 99% para la diferencia real en las calificaciones 
promedio de postexamen. Si necesitamos muestrear un numero igual de estudiantes de BACC y de 
los que aprenden de manera tradicional y buscamos que el ancho del intervalo de confianza sea 1.0, 
^cuantas observaciones deben incluirse en cada grupo? 
b Repita los calculos del inciso a si estamos interesados en comparer calificaciones promedio de pre- 
examen. 

c Suponga que la investigadora desea construir intervalos de confianza de 99% para comparer arnbas 
calificaciones, las de preexamen y las de postexamen, para estudiantes de biologfa de BACC y los 
que aprenden de manera tradicional. Si el objetivo de la investigadora es que ambos intervalos tengan 
anchos no mayores que 1 unidad, (,que tamanos muestrales deben usarse? 

8.8 Intervalos de confianza de una 
muestra pequena para /jl y jtq - /ul 2 

Los intervalos de confianza para una media poblacional /jl, que estudiaremos en esta seccion, 
estan basados en la suposicion de que la muestra del experimentador se ha seleccionado alea- 
toriamente de entre una poblacion normal. Los intervalos son apropiados para muestras de 
cualquier tamano y los coeficientes de confianza de los intervalos son cercanos a los valores 
especificados aun cuando la poblacion no sea normal, mientras la desviacion no sea excesi- 
va. Raras veces conocemos la forma de la distribucion de frecuencia poblacional antes de 
muestrear y, en consecuencia, si un estimador de intervalo debe ser de cualquier valor, debe 
funcionar razonablemente bien aun cuando la poblacion no sea normal. “Funcionar bien” 
significa que el coeficiente de confianza no debe ser afectado por desviaciones pequenas de la 
normalidad. Para la mayor parte de las distribuciones poblacionales en forma de campana, los 
estudios experimentales indican que estos intervalos de confianza mantienen coeficientes de 
confianza cercanos a los valores nominales empleados en su calculo. 

Suponemos que fj, Y 2 ,..., Y n representa una muestra aleatoria seleccionada de una pobla¬ 
cion normal y con Y y S 2 representamos la media y la varianza muestrales, respectivamente. 
Nos gustarfa construir un intervalo de confianza para la media poblacional, cuando V( Y ; ) = cr 
sea desconocida y el tamano de la muestra sea demasiado pequeno para permitirnos aplicar 
las tecnicas de muestra grande expuestas en la seccion anterior. Dadas las suposiciones que 
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FIGURA 8.10 
Ubicacion de 

t «/2 y - f «/2 


EJEMPLO 8.11 



acabamos de indicar, los Teoremas 7.1 y 7.3 y la Definition 7.2 implican que 


T 


Y-H 

S/Vn 


tiene una distribution t con (n - 1) grado de libertad. La cantidad T sirve como cantidad pivote 
que usaremos para formar un intervalo de confianza para /a. De la Tabla 5, Apendice 3, pode- 
mos hallar valores t ri/ , 2 y - r f(/2 (vea la Figura 8.10) de modo que 


P(~t a /2 ^ T < t a fl) = 1 - a. 


La distribution t tiene una funcion de densidad muy semejante a la densidad normal estan- 
dar excepto que las colas son mas anchas (como se ilustra en la Figura 7.3). Recuerde que los 
valores de r (l/ . 2 dependen de los grados de libertad (n - 1) asf como del coeficiente de confianza 
(1 - a). 

El intervalo de confianza para /jl se obtiene al manipular las desigualdades del enunciado 
de probabilidad, de modo analogo al empleado en la deduction presentada en el Ejemplo 8.6. 
En este caso, el intervalo de confianza resultante para /jl es 


Y ± t a/2 



De acuerdo con las suposiciones anteriores, tambien podemos obtener lfmites de confianza 
unilaterales de 100(1 - a)% para /jl. Observe que t a , dada en la Tabla 5, Apendice 3, es tal 
que 


P(X — t a ) = l-a. 

Sustituyendo T en esta expresion y manipulando la desigualdad resultante obtenemos 

P[Y ~ t a (S/\/n) ^ /jl] = 1 — a. 


Entonces, Y — t a (S/\fn) es un li'mite de confianza inferior de 100(1 - a)% para /jl. De la misma 
manera Y + t n (S/\/n) es un lfmite de confianza superior de 100(1 - a)% para /jl. Al igual que 
en el caso de una muestra grande, si determinamos los lfmites de confianza superior e inferior 
100(1 - a)% para j± y usamos los lfmites respectivos como puntos extremos para un intervalo de 
confianzas el intervalo bilateral resultante tiene coeficiente de confianza igual a 1 - 2a. 


Un fabricante ha inventado una nueva polvora que fue probada en ocho proyectiles. Las velo- 
cidades resultantes en la boca del canon, en pies por segundo, fueron las siguientes: 


3005 2925 2935 2965 

2995 3005 2937 2905 
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Encuentre un intervalo de confianza de 95% para el verdadero promedio de velocidad /jl para 
proyectiles de este tipo. Suponga que las velocidades en la boca del canon estan distribuidas 
normalmente en forma aproximada. 


Solucion 


Si suponemos que las velocidades Y t estan distribuidas normalmente, el intervalo de confianza 
para /jl es 


Y ± t a/2 



donde t a , 2 esta determinado por un n - 1 grados de libertad. Para los datos dados, y = 2959 y 
s = 39.1. En este ejemplo tenemos n - 1 = 7 grados de libertad y usando la Tabla 5, Apendice 
3, 4/2 = ^025 = 2.365. Entonces, obtenemos 

2959 ±2.365 obien, 2959 ± 32.7, 

como el intervalo de confianza observado para /jl. ■ 


Suponga que estamos interesados en comparar las medias de dos poblaciones normales, 

2 2 

una con media /jl 1 y varianza IJ \ y la otra con media /jl 2 y varianza cr 2 . Si las muestras son in- 
dependientes, los intervalos de confianza para p,, - /jl 2 basados en una variable aleatoria con 
distribucion t se pueden construir si suponemos que las dos poblaciones tienen una varianza 
comun pero desconocida (T \ — cr 2 — a" (desconocida). 

Si Y i y Y 2 son las medias muestrales respectivas obtenidas de muestras aleatorias indepen- 
dientes de poblaciones normales, el intervalo de confianza de muestra grande para (/Xj - /jl 2 ) 
se desarrolla usando 


Z = 


(Yi -Y 2 ) -0*i -in) 



como una cantidad pivote. Como supusimos que las poblaciones muestreadas estan distribuidas 
normalmente, Z tiene una distribucion normal estandar y usando la suposicion tT \ — — 

la cantidad Z se puede reescribir como 


(Yi -Y 2 )-Qh -fi 2 ) 


Debido a que <x es desconocida, necesitamos hallar un estimador de la varianza comun a 1 para 
que podamos generar una cantidad con distribucion t. 

Denotemos con Y n , Y n ,..., Y u la muestra aleatoria de tamano n l de la primera poblacion 
y denotemos con Y 2 i, Y 22 , . . . , F 2 „ 2 una muestra aleatoria independiente de tamano n 2 de la 
segunda poblacion. Entonces 


- 1 ^ 1 A 

Y^—Y'Yu y Y 2 = —YY 2i . 

«1 U «2 U 
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EJEMPLO 8.12 


El estimador insesgado usual de la varianza comun cr 2 se obtiene al agrupar los datos mues- 
trales para obtener el estimador ponderado Sp 


THhiYn -Ei) 2 + E"ii(y2,- -y 2 ) 2 

hi + n 2 — 2 


( ni -\)S 2 +(n 2 -l)S 2 
n\ + n 2 — 2 


donde Sf es la varianza muestral de la i-esima muestra, i = 1,2. Observe que si n, = n 2 , Sj t 
es simplemente el promedio de S 2 y S 2 . Si n l A n 2 . S' 2 es el promedio ponderado de S\ y S 2 , 
con mayor peso asignado a la varianza muestral asociada con el tamano muestral mas grande. 
Ademas, 


= (»! +»2-2)S 2 = y!UYu - FQ 2 E”lt (Y 2 j - y 2 ) 2 

fji fji fji 

es la suma de dos variables aleatorias independientes con distribucion \ 2 Y con Oq - 1) v 
(n 2 - 1) grados de libertad, respectivamente. Entonces, W tiene una distribucion x~ con v = 
(n l - 1) + (n 2 - 1) = (n 1 + n 2 - 2) grados de libertad. (Vea Teoremas 7.2 y 7.3.) Ahora usamos 
la variable W con distribucion \ 2 y la cantidad Z normal, estandar, independiente del parrafo 
anterior para formar una cantidad pivote: 


T = 



(Y 1 - y 2 ) - (Ml - M2) 



/ Um + n 2 ~ 2)S 2 P 
j y cr 2 (n\ + n 2 - 2) 


(Y\ ~Y 2 ) - (p ,i - p 2 ) 



una cantidad que por construction tiene una distribucion t con («, + n 2 - 2) grados de liber¬ 
tad. 

Procediendo como hicimos antes en esta section, vemos que el intervalo de confianza para 
(p 1 - jJi 2 ) tiene la forma 


(Y l -Y 2 )± t a/2 S p 



donde ? (t/s se determina a partir de Is distribucion t con (n ] + n 2 - 2) grados de libertad. 


Para alcanzar la maxima eficiencia al realizar una operation de ensamble en una planta ma- 
nufacturera, obreros nuevos requieren aproximadamente un periodo de capacitacion de 1 mes. 
Se sugirio un nuevo metodo de capacitacion y se realizo un examen para comparar el nuevo 
metodo contra el procedimiento estandar. Dos grupos de nueve obreros nuevos cada uno fue- 
ron capacitados durante 3 semanas, un grupo usando el nuevo metodo y el otro siguiendo el 
procedimiento estandar de capacitacion. El tiempo (en minutos) requerido por cada obrero 
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Tabla 8.3 Datos para el Ejemplo 8.12 


Procedimiento 



Mediciones 




Estandar 32 

37 

35 

28 41 44 

35 

31 

34 

Nuevo 35 

31 

29 

25 34 40 

27 

32 

31 


para ensamblar el dispositivo se registro al final del perfodo de 3 semanas. Las mediciones 
resultantes son las que se muestran en la Tabla 8.3. Calcule la diferencia real de las medias 
(/Xj - /jl 2 ) con coeficiente de confianza .95. Suponga que los tiempos de ensamble estan distri- 
buidos normalmente en forma aproximada, que las varianzas de los tiempos de ensamble son 
aproximadamente iguales para los dos metodos y que las muestras son independientes. 

Solucion Para los datos de la Tabla 8.3, con la muestra 1 denotando el procedimiento estandar, tene- 
mos 


y, = 35.22, 


y 2 = 31.56, 


9 


E(.vii - Vi) 2 


S 


2 

1 


195.56, 

24.445, 


9 


£<J2; - y 2 ) 2 


s 


2 

2 


160.22, 

20.027. 


Por tanto, 


s 


2 

P 


8(24.445) + 8(20.027) 
9 + 9-2 


195.56 + 160.22 
16 


22.236 y s p = 4.716. 


Observe que, como n l = n 2 = 9, s p es el promedio simple de y ' V| . Tambien, f 025 = 
2.120 para (n ] + n 2 - 2) = 16 grados de libertad. El intervalo de confianza observado es 
por tanto 


Ob - yi) ± t a / 2 s p 

1 1 1 

(35.22 - 31.56) ± (2.120)(4.716)J - + - 
3.66 ± 4.71. 

Este intervalo de confianza se puede escribir en la forma [-1.05, 8.37]. El intervalo es bastante 
ancho e incluye valores positivos y negativos. Si /jl 1 - j± 2 es positivo, /jl 1 > /jl 2 y el procedi¬ 
miento estandar tiene un tiempo de ensamble esperado mayor que el nuevo procedimiento. 
Si fiy - jJL 2 es realmente negativo, lo inverso es verdadero. Como el intervalo contiene valores 
positivos y negativos, se puede decir que ninguno de los metodos de capacitacion produce un 
tiempo medio de ensamble que difiera del otro. ■ 
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Resumen de intervalos de confianza de muestra pequena para medias de distribu¬ 
ciones normales con varianza(s) desconocida(s) 

Pardmetro 

Intervalo de confianza (v = grados de libertad) 

M 

7±, °' 2 {zk)- 

Ml “M2 

(y i — Y 2 ) ± t a/2 S p — + —, 

V «1 «2 


donde v = n\ + «2 — 2 y 


c2 (m -DSl + ino-DS* 
p m+m-2 


(requiere que las muestras sean independientes 
y la suposicion de que oq = cr 2 ). 


Cuando el tamano (o tamanos) de la muestra se hace grande, el numero de grados de liber- 
tad para la distribucion t aumenta y la distribucion t puede ser calculada en forma muy precisa 
por la distribucion normal estandar. En consecuencia, los intervalos de confianza de una mues¬ 
tra pequena de esta seccion son casi indistinguibles respecto de los intervalos de confianza de 
muestra grande de la Seccion 8.6 para n grande (o n t y n 1 grandes). Los intervalos son casi 
equivalentes cuando los grados de libertad exceden de 30. 

Los intervalos de confianza para una sola media y la diferencia en dos medias se generaron 
con las suposiciones de que las poblaciones de interes estan distribuidas normalmente. Hay 
suficiente evidencia practica de que estos intervalos mantienen su coeficiente de confianza no¬ 
minal mientras las poblaciones muestreadas tengan distribuciones con forma casi de campana. 
Si= n 2 , los intervalos de - fi 2 tambien mantienen sus coeficientes de confianza nomina- 
les mientras las varianzas poblacionales sean aproximadamente iguales. La independencia de 
las muestras es la suposicion mas critica al usar los intervalos de confianza desarrollados en 
esta seccion para comparar dos medias poblacionales. 


Ejercicios 

8.80 Aun cuando hay muchos tratamientos para la bulimia nervosa , algunas personas no se benefician de 
ellos. En un estudio para determinar que factores predicen quien se beneficiara con el tratamiento, 
Wendy Baell y E. H. Wertheim 12 encontraron que la autoestima era uno de los pronosticadores irn- 
portantes. La media y la desviacion estandar de los valores postratamiento de autoestima para n = 21 
personas fueron y = 26.6 y s = 7.4, respectivamente. Encuentre un intervalo de confianza de 95% para 
los verdaderos valores de postratamiento de autoestima. 

8.81 Las longitudes de caparazones de diez langostas examinados en un estudio de la infestacion de la lan- 
gosta Themis orientalis por dos tipos de lapas, Octolasmis tridens y O. lowei se dan en la siguiente tabla. 


12. Fuente: Wendy K. Baell y E. H. Wertheim, “Predictors of Outcome in the Treatment of Bulimia Nervosa," British 
Journal of Clinical Psychology 31 (1992). 
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Encuentre un intervalo de confianza de 95% para la longitud media de caparazon (en milfmetros, mm) 
de langostas T. orientalis atrapadas en los mares en las cercanfas de Singapur. 13 

Numero de campo de langosta A061 A062 A066 A070 A067 A069 A064 A068 A065 A063 
Longitud del caparazon (mm) 78 66 65 63 60 60 58 56 52 50 


8.82 Las calificaciones del Examen de Evaluation Escolar (SAT por sus siglas en ingles), que han bajado 
lentamente desde el inicio del examen, ahora han empezado a subir. Originalmente, una calificacion de 
500 estaba considerada como promedio. Las calificaciones medias para 2005 fueron aproximadamente 
508 para el examen verbal y 520 para el examen de matematicas. Una muestra aleatoria de las califica- 
ciones del examen, de 20 alumnos de ultimo ano de una preparatoria urbana de gran tamano, produjo las 
medias y desviaciones estandar citadas en la tabla siguiente: 



Verbal 

Matematicas 

Media muestral 

505 

495 

Desviacion estandar muestral 

57 

69 


a Encuentre un intervalo de confianza de 90% para la media de calificaciones del SAT verbal para 
alumnos de ultimo ano de preparatoria urbana. 

b ^,E1 intervalo hallado por usted en el inciso a incluye el valor 508, la calificacion media real del SAT 
verbal para 2005? (,Que puede concluir? 

c Construya un intervalo de confianza de 90% para la calificacion media del SAT de matematicas para 
alumnos de ultimo ano de preparatoria urbana. ^,E1 intervalo incluye 520, la calificacion media real 
de matematicas para 2005? (,Que puede concluir? 

8.83 El smdrome cronico de la section anterior es un estado de salud caracterizado por dolor inducido por 
ejercicio en la parte inferior de las piemas. Hinchazon y una funcion deteriorada de nervios y musculos 
tambien acompanan al dolor, que se alivia con reposo. Susan Beckham y sus colegas 14 realizaron un 
experimento que abarco diez corredores en buenas condiciones fisicas, asf como diez ciclistas tambien 
en buenas condiciones fisicas, para determinar si las mediciones de presion dentro de la section anterior 
del musculo difieren entre corredores y ciclistas. Los datos —presion en la section, en milfmetros de 
mercurio— se resumen en la tabla siguiente: 


Corredores 

Ciclistas 

Condition Media 

s 

Media 

s 

Reposo 14.5 

80% de maximo consumo de 0 2 12.2 

3.92 

3.49 

11.1 

11.5 

3.98 

4.95 


a Construya un intervalo de confianza de 95% para la diferencia en la media de las presiones en la 
section entre corredores y ciclistas en condition de reposo. 
b Construya un intervalo de confianza de 90% para la diferencia en la media de las presiones en la 
section entre corredores y ciclistas que se ejercitan al 80% de maximo consumo de oxfgeno (0 2 ). 
c Considere los intervalos construidos en los incisos a y b. ^Como interpretarfa los resultados obteni- 
dos? 


13. Fuente: W. B. Jeffries, H. K. Voris y C. M.Yang, “Diversity and Distribution of the Pedunculate Barnacle Octolas- 
mis Gray, 1825 Epizoic on the Scyllarid Lobster, Thenus orientalis (Lund 1793),” Crustaceana 46(3)f 1984). 

14. Fuente: S. J. Beckham, W. A. Grana, P. Buckley, J. E. Breasile, y P. L. Claypool, “A Comparison of Anterior 
Compartment Pressures in Competitive Runners and Cyclists,” American Journal of Sports Medicine 21 (1)(1993). 
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8.84 Es frecuente que los qufmicos organicos purifiquen compuestos organicos por medio de un metodo co- 
nocido como cristalizacion fraccional. Un experimentador desea preparar y purificar 4.85 g de anilina. 
Diez especfmenes de 4.85 gramos de anilina se prepararon y purificaron para producir acetanilida. Se 
obtuvieron los siguientes resultados en seco: 

3.85, 3.88, 3.90, 3.62, 3.72, 3.80, 3.85, 3.36, 4.01, 3.82 

Construya un intervalo de confianza de 95% para el numero medio de gramos de acetanilida que se 
puede recuperar de 4.85 gramos de anilina. 

8.85 Dos nuevos medicamentos se dieron a pacientes con hipertension. El primero de ellos bajo la presion 
sanguinea de 16 pacientes un promedio de 11 puntos, con una desviacion estandar de 6 puntos; el se- 
gundo bajo la presion de otros 20 pacientes en un promedio de 12 puntos, con desviacion estandar de 
8 puntos. Determine un intervalo de confianza de 95% para la diferencia en las reducciones medias en 
presion sanguinea, suponiendo que las mediciones estan distribuidas normalmente con varianzas igua- 
les. 

8.86 ^E1 precio pagado por el atun depende del metodo de empaque? Consumer Reports da el precio prome¬ 
dio estimado para una lata de 6 onzas o una bolsa de 7.06 onzas de atun, con base en precios pagados a 
nivel nacional en supermercados. 15 Los precios se registran para una variedad de marcas de atun en la 
tabla siguiente: 


Atun claro 
en agua 

Atun bianco 

en aceite 

Atun bianco 
en agua 

Atun claro 

en aceite 

0.99 

0.53 

1.27 

1.49 

1.29 

2.56 

0.62 

1.92 

1.41 

1.22 

1.29 

1.00 

1.92 

0.66 

1.23 

1.12 

1.19 

1.27 

1.27 

1.30 

0.62 

0.85 

0.63 

1.22 

1.35 

1.28 

1.79 

0.65 

0.65 

0.67 




1.23 

0.60 

0.69 

0.60 





0.67 

0.60 

0.66 







Suponga que las marcas de atun incluidas en el estudio representan una muestra aleatoria de todas las 
marcas de atun existentes en Estados Unidos. Encuentre un intervalo de confianza de 95% 

a para el precio promedio de atun claro empacado en agua. Interprete el intervalo. Especificamente, ^a 
que se refiere el “95%”?, 

b para el precio promedio de atun claro empacado en aceite. ^Como se compara el ancho de este inter¬ 
valo con el del intervalo hallado en el inciso a? De tres razones por las que difieren las longitudes de 
los intervalos. 

8.87 Consulte el Ejercicio 8.86. 

a Construya un intervalo de confianza de 90% para la diferencia en el precio medio de atun claro em¬ 
pacado en agua y atun claro empacado en aceite. 

b Con base en el intervalo obtenido en el inciso a, ^piensa usted que los precios medios difieren para 
atun claro empacado en agua y aceite? ^Por que? 

8.88 La Environmental Protection Agency (EPA) ha recolectado datos sobre mediciones de LC50 (concentra- 
ciones que matan a 50% de los animales de prueba) para ciertos productos qufmicos que es probable se 


15. Fuente: Caso real “Pricing of Tuna” Copyright 2001 por la Consumers Union of U.S.Jnc., Yonkers,N.Y. 1073- 
1057, organization sin fines de lucro. De la edition de junio de 2001 de Consumers Reports © solo para fines educa- 
cionales. NO se permite el uso comercial ni la reproduccion. www.ConsumerReports.org. 
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8.89 


8.90 


8.91 


8.92 


*8.93 


encuentren en rfos y lagos de agua dulce. (Para mas detalles, vea el Ejercicio 7.13.) Para cierta especie 
de peces, las mediciones de LC50 (en partes por millon) de DDT en 12 experimentos fueron las siguien- 
tes: 


16, 5, 21, 19, 10, 5, 8, 2, 7, 2, 4, 9 

Calcule la media real de LC50 para DDT con un coeficiente de confianza 0.90. Suponga que las medi¬ 
ciones de LC50 tienen una distribucion aproximadamente normal. 

Consulte el Ejercicio 8.88. Otro insecticida comun, el diazinon, dio mediciones de LC50 en tres experi¬ 
mentos de 7.8, 1.6 y 1.3. 

a Calcule la media de LC50 para diazinon, con un intervalo de confianza de 90%. 
b Calcule la diferencia entre la media de LC50 para DDT y para diazinon, con un intervalo de confian¬ 
za de 90%. (,Que suposiciones son necesarias para que el metodo que se uso sea valido? 

^Las calificaciones del SAT para estudiantes de preparatoria difieren dependiendo del campo de estudio 
futuro de los estudiantes? Quince estudiantes que deseaban especializarse en ingenierla se compararon 
con 15 estudiantes que deseaban especializarse en idioma y literatura. En la siguiente tabla se dan las 
medias y desviaciones estandar de las calificaciones de la parte verbal y de matematicas de los examenes 
SAT para los dos grupos de estudiantes: 16 




Verbal 


Matematicas 

Ingenierla 

y 

= 446 s 

= 42 

y = 548 s =51 

Idiomas/literatura 

y 

= 534 i 

= 45 

y = 517 s = 52 


a Construya un intervalo de confianza de 95%, para la diferencia en el promedio de calificaciones de 
examen verbal de estudiantes que se especializan en ingenierla y los que se especializan en idiomas/ 
literatura. 

b Construya un intervalo de confianza para la diferencia en el promedio de calificaciones de matematicas 
para estudiantes que se especializan en ingenierla y para los que se especializan en idiomas/literatura. 
c Interprete los resultados obtenidos en los incisos a y b. 

d iQue suposiciones son necesarias para que sean validos los metodos empleados previamente? 

Biologos de la Comision de Caza y Pesca de Florida observaron las zonas de distribucion estacionales 
(en hectareas) para caimanes en un lago en las afueras de Gainesville, Florida. Cinco caimanes obser- 
vados en la primavera mostraron zonas de distribucion de 8.0, 12.1, 8.1, 18.2 y 31.7. Cuatro caimanes 
diferentes observados en el verano mostraron zonas de distribucion de 102.0, 81.7, 54.7 y 50.7. Calcule 
la diferencia entre zonas de distribucion medias en primavera y verano, con un intervalo de confianza de 
95%. ^Que suposiciones hizo? 

El cobre solido, producido por sinterizacion (calentamiento sin fundir) de un polvo en condiciones am- 
bientales especificadas, se mide a continuacion para ver su porosidad (en fraccion de volumen debido a 
huecos) en un laboratorio. Una muestra de n l = 4 mediciones independientes de porosidad tienen una 
media de jq = .22 y varianza de s 2 = .0010. . Un segundo laboratorio repite el mismo proceso en co¬ 
bre solido formado de un polvo identico y obtiene n 2 = 5 mediciones independientes de porosidad con 
y 2 = -17 y if = -0020. Calcule la diferencia real entre las medias poblacionales (ji 2 - /jl 2 ) para estos 
dos laboratories, con un coeficiente de confianza de .95. 

Una fabrica opera con dos maquinas de tipo A y una maquina de tipo B. Los costos X de reparaciones 
semanales para maquinas tipo A estan normalmente distribuidos con media /jl 1 y varianza a 2 . Los costos 
de reparaciones semanales Y para maquinas de tipo B tambien estan distribuidos normalmente pero con 


16. Fuente: "SAT escore by Intended Field of Study”, Riverside (Calif) Press Enterprise, 8 de abril de 1993. 
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media p 2 y varianza 3a 2 . El costo esperado de reparation por semana para la fabrica es entonces 2p t 
+ /. l 2 . Si tenemos una muestra aleatoria X v X 2 , . . . , X n de los costos de maquinas tipo A y una muestra 
aleatoria independiente Y v Y 2 ,. . ., Y m de los costos para maquinas tipo B. describa como construiria un 
intervalo de confianza de 95% para 2p t + p 2 

a si se conoce a 2 , 
b si no se conoce cr 2 . 

8.94 Suponga que obtenemos muestras independientes de tamanos n x y n 2 de dos poblaciones normales con 
varianzas iguales. Utilice la cantidad pivote apropiada de la Section 8.8 para deducir un Umite de con¬ 
fianza superior 100(1 - a)% para p 2 - p 2 . 


8.9 Intervalos de confianza para a 2 

La varianza poblacional cr 2 cuantifica la cantidad de variabilidad en la poblacion. Muchas 
veces el valor real de cr 2 es desconocido para un experimentador y debe calcularse. En la 
Section 8.3 demostramos que S 2 = [\/{n — 1)] Yl'i= i (T; “ L) 2 es un estimador insesgado 
para cr 2 . Cuando generamos intervalos de confianza para p, usamos .S' 2 para calcular cr 2 cuando 
era desconocida. 

Ademas de necesitar information acerca de cr 2 para calcular intervalos de confianza para p 
y p x - p 2 , podemos estar interesados en construir un intervalo de confianza para cr 2 . Por ejem- 
plo, si efectuamos un cuidadoso analisis quimico de tabletas de un medicamento en particular, 
estanamos interesados en la cantidad promedio del ingrediente activo por tableta v ademas 
en la cantidad de variabilidad de una tableta a otra, cuantificada por cr 2 . Obviamente, para un 
medicamento es preferible que la variation de una tableta a otra sea pequena y por tanto un 
valor pequeno para cr 2 . 

Para continuar con nuestro procedimiento de calculo de intervalos necesitamos la exis- 
tencia de una cantidad pivote. De nuevo, suponemos que tenemos una muestra aleatoria Y v 
Y 2 , . . . , Y n de una distribution normal con media p y varianza cr 2 , ambas desconocidas. Del 
Teorema 7.3 sabemos que 


£?=i( Y t ~ Y) 2 _ 0 n - 1)5 2 

st-2 st-2 


tiene una distribucion x 2 con ( n ~ 1) grados de libertad. Entonces podemos proseguir con el 

2 2 

metodo del pivote para hallar dos numeros Xl y Xu tales que 


P 



(n - 1)S 2 



= 1 — a 


para cualquier coeficiente de confianza (1 - a). (Los subindices L y U representan bajo y 
alto, respectivamente.) La funcion de densidad no es simetrica, de modo que tenemos algu- 
na libertad para seleccionar XL y Xu- Nos gustarfa hallar el intervalo mas corto que incluya cr 2 
con probabilidad (1 - a). En general, esto es difitil y requiere una busqueda de prueba y error 
para los valores apropiados de Xl y Xu- Elegiremos de manera arbitraria puntos que limiten 
areas iguales de cola, como se indica en la Figura 8.11. En consecuencia, obtenemos 


P 


[ 


X\-(olI2) 


(n - 1 )S 2 ^ 2 

~ X(a! 2 ) 


= 1 — a. 
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y un reordenamiento de la desigualdad en el enunciado de probabilidad nos lleva a 

_ 1 'i c2 


(n-l)S z 2 (n-l)S z 

< CT < -r 


v 2 

A (a/2) 


El intervalo de confianza para cr 2 es el siguiente. 


AT—(a/2) 


= 1 — a. 


Un intervalo de confianza 100(1 - a)% para a 2 

/(n-l)S 2 (n-l/S 2 ' 

\ Xa/2 Xl-( a /2) , 


EJEMPLO 8.13 Un experimentador desea comprobar la variabilidad de mediciones obtenidas al usar equipo 
disenado para medir el volumen de una fuente de audio. Tres mediciones independientes re- 
gistradas por este equipo para la misma fuente de sonido fueron 4.1,5.2 y 10.2. Estime cr 2 con 
coeficiente de confianza .90. 


Solucion Si se puede suponer normalidad en las mediciones registradas por este equipo, se puede aplicar 
el intervalo de confianza que acabamos de desarrollar. Para los datos dados, ,v 2 = 10.57. Con 
a/2 = .05 y (n - 1) = 2 grados de libertad, la Tabla 6 , Apendice 3, senala que = . 103 y 
^05 = 5.991. Entonces, el intervalo de confianza de 90% para cr 2 es 

f(n-l)s 2 (n~l)s 2 \ ( (2)(10.57) (2)( 10.57) \ 

vxsr- -x&r) ob,en v^99i- I* 

y finalmente (3.53, 205.24). 

Observe que este intervalo para cr 2 es muy ancho, principalmente porque n es muy pe- 
quena. ■ 


Ya antes hemos indicado que los intervalos de confianza desarrollados en la Seccion 8.8 
para /i y /i, - /i ; tenian coeficientes de confianza cercanos al nivel nominal incluso si las 
poblaciones basicas no estaban distribuidas normalmente. En contraste, los intervalos para cr 2 
presentados en esta seccion pueden tener coeficientes de confianza que difieren en un modo 
muy marcado con respecto al nivel nominal si la poblacion muestreada no esta distribuida 
normalmente. 
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Ejercicios 

8.95 La Environmental Protection Agency (EPA) ha establecido un maximo nivel de ruido de 83 decibeles 
(dB) para camiones pesados. La forma en la que se aplique este llmite afectara considerablemente al 
publico y a la industria del transporte por carretera . Una forma de aplicar los llmites es exigir que todos 
los camiones se apeguen al llmite de ruido. Un segundo metodo menos satisfactorio es exigir que el nivel 
medio de ruido de la flota de camiones sea menor al llmite. Si se adopta esta ultima regia, la variacion 
en el nivel de ruido de un camion a otro se hace importante porque un valor grande de cr 2 implicarla que 
muchos camiones rebasen ese llmite, incluso si el nivel medio de la flota fuera de 83 dB. Una muestra 
aleatoria de seis camiones pesados produjo los siguientes niveles de ruido (en decibeles): 

85.4 86.8 86.1 85.3 84.8 86.0. 

Use estos datos para construir un intervalo de confianza de 90% para a 2 , la varianza de las lecturas de 
emision de ruido de camiones. Interprete sus resultados. 

8.96 En el Ejercicio 8.81 dimos las longitudes de los caparazones de diez langostas maduras Thenus orienta- 
lis atrapadas en los mares en las cercanlas de Singapur. Para su comodidad, los datos se reproducen aqul. 
Supongamos que usted desea describir la variabilidad de las longitudes del caparazon de esta poblacion 
de langostas. Encuentre un intervalo de confianza de 90% para la varianza poblacional cr 2 . 

Numero de sector de la langosta A067 A062 A066 A070 A067 A069 A064 A068 A065 A063 

Longitud del caparazon (mm) 78 66 65 63 60 60 58 56 52 50 

8.97 Suponga que S 2 es la varianza muestral basada en una muestra de tamano n de una poblacion normal con 
media y varianza desconocidas. Deduzca un 

a llmite de confianza superior al 100(1 - a) para cr 2 
b llmite de confianza inferior al 100( 1 - a) para cr 2 . 

8.98 Dada una muestra aleatoria de tamano n de una poblacion normal con media y varianza desconocidas, 
generamos un intervalo de confianza para la varianza poblacional cr 2 en esta section. ^Cual es la formula 
para un intervalo de confianza para la desviacion estandar poblacional <x? 

8.99 En el Ejercicio 8.97 dedujimos llmites de confianza superior e inferior, cada uno con coeficiente de 
confianza 1 - a, para cr 2 . ^Como construirlamos un 

a llmite de confianza superior al 100(1 - a) para cr? 
b llmite de confianza inferior al 100(1 - cr) para cr? 

8.100 Los focos industriales deberlan tener una vida media util aceptable para usuarios potenciales y una va¬ 
riacion relativamente pequena en su duration. Si algunos focos fallan demasiado pronto en su vida util, 
los usuarios se molestan y es probable que los cambien por focos producidos por un fabricante diferente. 
Variaciones grandes por arriba de la media reducen las ventas de reemplazo; en general, la variacion en 
la vida util de los focos altera los programas de cambio establecidos por los usuarios. Una muestra alea¬ 
toria de 20 focos producidos por un fabricante particular produjo los siguientes valores de vida util (en 
horas): 

2100 2302 1951 2067 2415 1883 2101 2146 2278 2019 

1924 2183 2077 2392 2286 2501 1946 2161 2253 1827 

Establezca un llmite de confianza superior de 99% para la desviacion estandar de las duraciones de vida 
util para los focos producidos por este fabricante. ^La verdadera desviacion estandar poblacional es 
menor que 150 horas? ^Por que si o por que no? 

8.101 En el trabajo de laboratorio es deseable realizar cuidadosas verificaciones de la variabilidad de lectures 
producidas en muestras estandar. En un estudio de la cantidad de calcio en agua potable realizado como 
parte de una evaluation de calidad del agua, la misma muestra estandar se hizo pasar por el laboratorio 
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8.102 


8.103 


8.10 


seis veces en intervalos aleatorios. Las seis lecturas, en partes por millon, fueron 9.32, 9.48, 9.48, 9.70 y 
9.26. Estime la varianza poblacional a 2 para lecturas en este estandar, usando un intervalo de confianza 
de 90%. 

Las edades de una muestra aleatoria de cinco profesores universitarios son 39, 54, 61, 72 y 59. Usando 
esta informacion encuentre un intervalo de confianza de 99% para la desviacion estandar poblacional 
de las edades de todos los profesores de la universidad, suponiendo que las edades de los profesores 
universitarios estan distribuidas normalmente. 

Un instrumento de precision esta garantizado para dar lecturas que no varfan mas de 2 unidades. Una 
muestra de cuatro lecturas del instrumento en el mismo objeto dio las mediciones 353, 351, 351 y 355. 
Encuentre un intervalo de confianza de 90% para la varianza poblacional. ^Que suposiciones son nece- 
sarias? ^Parece razonable la garantfa? 


Resumen 

El objetivo de muchas investigaciones estadfsticas es hacer inferencias acerca de parametros 
de la poblacion con base en datos muestrales. Es frecuente que estas inferencias tomen la for¬ 
ma de estimaciones, ya sea puntuales o de intervalo. Preferimos estimadores insesgados con 
varianza pequena. La bondad de un estimador insesgado 9 puede ser medida por og porque el 
error de estimacion es generalmente menor que 2cr§ con una alta probabilidad. El error cua- 
dratico medio de un estimador, MSE(0) = V(6) + [ B(0)] 2 , es pequeno solo si el estimador 
tiene varianza pequena y sesgo pequeno. 

Las estimaciones de intervalo de muchos parametros, por ejemplo /jl y p, se pueden ob- 
tener a partir de la distribucion normal para tamanos muestrales grandes debido al teorema 
del lfmite central. Si los tamanos muestrales son pequenos, debe suponerse normalidad de 
la poblacion y la distribucion t se usa para generar intervalos de confianza. No obstante, el 
intervalo para una sola media es bastante estable en relacion con desviaciones moderadas a 
partir de la normalidad. Esto es, el coeficiente de confianza real asociado con intervalos que 
tienen un coeficiente nominal de confianza de 100(1 - a)% es muy cercano al nivel nominal 
incluso si la distribucion poblacional difiere moderadamente de la normalidad. El intervalo de 
confianza para una diferencia en dos medias tambien es estable en relacion con desviaciones 
moderadas de la normalidad y con respecto a la suposicion de varianzas poblacionales iguales 
si n ] ~ n 2 . Cuando n l y n 2 se hacen mas diferentes, la suposicion de varianzas poblacionales 
iguales se hace mas importante. 

Si se han seleccionado mediciones muestrales de una distribucion normal, se puede desa- 
rrollar un intervalo de confianza para a 2 mediante el uso de la distribucion \ 2 - Estos intervalos 
son muy sensibles a la suposicion de que la poblacion basica esta distribuida normalmente. En 
consecuencia, el coeficiente de confianza real asociado con el procedimiento de estimacion 
de intervalo puede diferir en forma marcada del valor nominal si la poblacion basica no esta 
distribuida normalmente. 
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Ejercicios complementarios 

8.104 Opcion multiple Se realizo un estudio para determinar que servicios prefieren los adultos en la telefonla 
celular. Los resultados del estudio demostraron que 73% de usuarios de telefonos celulares deseaban 
servicios de e-mail, con un margen de error de ±4%. ^Que quiere decir la frase “±4%”? 

a Estiman que 4% de la poblacion encuestada puede cambiar de idea entre el tiempo en que se realizo 
la encuesta y aquel en el que se publicaron los resultados. 
b Hay una probabilidad de 4% de que el porcentaje real de usuarios de telefonos celulares que desean 
servicio de e-mail no este en el intervalo (0.69, .077). 
c Solo 4% de la poblacion fue encuestada. 

d Serfa poco probable obtener la proporcion muestral observada de 0.73 a rnenos que la proporcion real 
de usuarios de telefonos celulares que desean e-mail este entre 0.69 y 0.77. 
e La probabilidad es .04 de que la proporcion muestral este en el intervalo (0.69, .077). 

8.105 Una muestra aleatoria de tamano 25 se tomo de una poblacion normal con a 2 = 6. Un intervalo de 
confianza para la media se dio como (5.37, 7.37). ^,Cual es el coeficiente de confianza asociado con este 
intervalo? 

8.106 En un estudio de polinizacion controlada donde aparece la Phlox drummondii, una planta anual que 
florece en primavera y que es comun a lo largo de carreteras en terrenos arenosos en la region central de 
Texas, Karen Pittman y Donald Levin 17 encontraron que los porcentajes de supervivencia de semillas 
no eran afectados por la escasez de agua o de nutrientes. En el experimento, las flores en plantas fueron 
identificadas como machos cuando donaban polen y como hembras cuando eran polinizadas por polen 
donador en tres grupos de tratamiento: control, con poca agua y con pocos nutrientes. Los datos de la 
siguiente tabla reflejan un aspecto de los hallazgos del experimento: el numero de semillas que sobrevi- 
ven hasta la madurez de cada uno de los tres grupos para padres machos y hembras. 




Macho 


Hembra 

Tratamiento 

n 

Numero de 
sobrevivientes 

n 

Numero de 
sobrevivientes 

Control 

585 

543 

632 

560 

Poco agua 

578 

522 

510 

466 

Pocos nutrientes 

568 

510 

589 

546 


a Encuentre un intervalo de confianza de 99% para la diferencia entre las proporciones de superviven¬ 
cia en el grupo de poca agua contra el grupo de pocos nutrientes para padres machos, 
b Encuentre un intervalo de confianza de 99% para la diferencia entre las proporciones de superviven¬ 
cia en pares machos y hembras sometidos a poca agua. 


17. Fuente: Karen Pittman y Donald Levin, “Effects of Parental Identities and Environment on Components of Cros¬ 
sing Success on Phlox drummondii”, American Journal of Botany 76(3)(1989). 
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8.107 Consulte el Ejercicio 8.106. Supongamos que usted planea estimar la diferencia en los porcentajes de 
supervivencia de semillas para padres machos en ambientes de poca agua y pocos nutrientes a no mas de 
.03 con probabilidad .95. Si planea usar un numero igual de semillas de padres machos en cada ambiente 
(es decir, n 1 = n 2 ) ^que tan grandes deben ser n 1 y « 2 ? 

8.108 Una qufmica que ha preparado un producto disenado para matar 60% de un tipo particular de insectos, 
desea evaluar el porcentaje de muertes causadas por su preparation. ^Que tamano muestral debe usar si 
desea tener 95% de confianza de que sus resultados experimentales caigan a no mas de .02 de la fraction 
real de insectos muertos? 

8.109 Para estimar la proportion de trabajadores desempleados en Panama, un economista selecciona aleato- 
riamente 400 personas de la clase trabajadora. De estas, 25 estaban desempleadas. 

a Estime la proportion real de trabajadores desempleados y determine lfmites para el error de estima¬ 
tion. 

b ^Cuantas personas deben muestrearse para reducir el lfmite de error de estimation a .02? 

8.110 La experiencia pasada demuestra que la desviacion estandar del ingreso anual de trabajadores textiles 
en cierto estado es $400. ^Cuantos trabajadores textiles serfa necesario muestrear si se desea estimar la 
media poblacional a no mas de $50.00, con probabilidad .95? 

8.111 ^Cuantos votantes deben estar incluidos en una muestra recolectada para calcular la fraction del voto 
favorable a un candidato presidencial en una election national, si la estimation debe ser correcta con 
tolerancia no mayor que .005? Suponga que la fraction verdadera se encuentra en la cercanfa de .5. Use 
un coeficiente de confianza de aproximadamente .95. 

8.112 En una encuesta tomada entre estudiantes universitarios, 300 de entre 500 hombres de la fraternidad 
estuvieron a favor de cierta proposition, en tanto que 64 de entre 100 que no pertenetian a la fraternidad 
estaban a favor de la proposition. Estime la diferencia en las proporciones que estaban a favor de la 
proposition y ponga un lfmite de desviacion estandar de 2 en el error de estimation. 

8.113 Consulte el Ejercicio 8.112. ^Cuantos hombres pertenecientes a la fraternidad y no pertenecientes a 
ella deben incluirse en una encuesta si deseamos obtener una estimation, con un error maximo de .05, 
para la diferencia en las proporciones a favor de la proposition? Suponga que los grupos seran de igual 
tamano y que p = .6 sera suficiente como aproximacion de ambas proporciones. 

8.114 Un proceso qufmico ha producido, en promedio, 800 toneladas de productos qufmicos al dfa. Las pro- 
ducciones diarias de la semana pasada son 785, 805, 790, 793 y 802 toneladas. Estime la production 
media diaria, con coeficiente de confianza de .90, a partir de los datos. ^Que suposiciones es necesario 
hacer? 

8.115 Consulte el Ejercicio 8.114. Encuentre un intervalo de confianza de 90% para cr 2 , la varianza de las 
producciones diarias. 

8.116 ^Perdemos nuestra capacidad de memoria cuando envejecemos? En un estudio del efecto de la glucosa 
en la memoria de hombres y mujeres ancianos, C. A. Manning y colegas 18 hicieron una prueba a 16 
voluntarios (5 hombres y 11 mujeres) acerca de su memoria de largo plazo, registrando el numero de 
palabras recordadas de una lista lefda a cada persona. A cada una de estas se le recordaron las pala- 
bras olvidadas y se le pidio recordar tantas palabras como fuera posible de la lista original. La media 
y desviacion estandar de las calificaciones de memora a largo plazo fueron y = 79.47 y s = 25.25. 
Proporcione un intervalo de confianza de 99% para las calificaciones de recordar palabras a largo plazo 
para hombres y mujeres ancianos. Interprete este intervalo. 

8.117 El crecimiento anual del tallo principal, medido de una muestra de 17 pinos rojos de 4 anos de edad, 
produjo una media de 11.3 pulgadas y una desviacion estandar de 3.4 pulgadas. Encuentre un intervalo de 
confianza de 90% para el crecimiento anual medio del tallo principal de una poblacion de pinos rojos de 4 
anos de edad sometidos a condiciones ambientales similares. Suponga que las cantidades de crecimiento 
estan distribuidas normalmente. 

18. Fuente: C. A. Manning, J. L. Hall y P. E. Gold, “Glucose Effects on Memory and Other Neuropsychological Tests 
in Elderly Humans”, en Psychological Science 1(5)(1990). 
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8.118 Debido a la variabilidad de los descuentos, la utilidad por cada auto nuevo vendido por un distribuidor 
de autos varfa de un auto a otro. Las utilidades por venta (en cientos de dolares), tabuladas para la se- 
mana pasada, fueron 2.1, 3.0, 1.2, 6.2, 4.5 y 5.1. Encuentre un intervalo de confianza de 90% para la 
utilidad media por venta. i,Que suposiciones deben ser validas para que la tecnica que usted utilizo sea 
la apropiada? 

8.119 Un examen de matematicas se aplica a un grupo de 50 estudiantes de la secundaria 1 seleccionados 
aleatoriamente y tambien a un grupo de 45 estudiantes de la secundaria 2 seleccionados de la misma ma- 
nera. Para el grupo de la secundaria 1, la media muestral es 75 puntos y la desviacion estandar muestral 
es 10 puntos. Para el grupo de la secundaria 2, la media muestral es 72 puntos y la desviacion estandar 
muestral es 8 puntos. Construya un intervalo de confianza de 95% para la diferencia en las calificaciones 
medias. ^Que suposiciones son necesarias? 

8.120 Dos metodos para ensenar a leer se aplicaron a dos grupos de ninos de primaria seleccionados aleatoria¬ 
mente y se compararon con base en un examen de comprension de lectura aplicado al final del periodo 
de ensenanza. Las medias muestrales y varianzas calculadas a partir de las calificaciones de examen se 
muestran en la siguiente tabla. Encuentre un intervalo de confianza de 95% para (/Xj - /x 2 ). (,Q U ® supo¬ 
siciones son necesarias? 


Estadfstico 

Metodo 1 

Metodo 2 

Numero de ninos en el grupo 

11 

14 

y 

64 

69 

s 2 

52 

71 


8.121 Una comparacion de los tiempos de reaction para dos estfmulos diferentes en un experimento psicologi- 
co de asociacion de palabras produjo los resultados (en segundos) que se muestran en la siguiente tabla 
cuando se aplico a una muestra aleatoria de 16 personas. Obtenga un intervalo de confianza de 90% para 
(/xj - /x 2 ). (,Que suposiciones son necesarias? 


Esttmulo 1 

Esttmulo 2 

1 

2 

4 

1 

3 

1 

2 

2 

2 

3 

3 

3 

1 

2 

3 

3 


8.122 El lapso entre la facturacion y el pago se registro para una muestra aleatoria de 100 clientes de una em- 
presa de contadores publicos titulados. La media muestral y la desviacion estandar para las 100 cuentas 
fueron 39.1 dtas y 17.3 dtas, respectivamente. Encuentre un intervalo de confianza de 90% para la media 
del tiempo que transcurre entre la facturacion y el pago para las 100 cuentas de la empresa de contado¬ 
res. Interprete el intervalo. 

8.123 Los anunciantes en television pueden creer erroneamente que casi todas las personas que ven TV en- 
tienden la mayor parte de los anuncios que ven y escuchan. Un estudio de investigation reciente pidio 
a 2300 personas de mas de 13 anos de edad que vieran extractos de publicidad de television de 30 se¬ 
gundos de duration. De estos, 1914 televidentes entendieron mal todo o parte del extracto que vieron. 
Encuentre un intervalo de confianza de 95% para la proportion de todos los teleespectadores (de los 
cuales la muestra es representativa) que entenderan mal el total o parte de los extractos de television 
empleados en este estudio. 

8.124 Una encuesta a 415 ejecutivos corporativos, de gobiemo y contadores de la Financial Accounting 
Foundation encontro que 278 consideraban el flujo de caja (lo contrario de ganancias por action, 
etc.) como el indicador mas importante de la salud financiera de una compama. Suponga que estos 
415 ejecutivos constituyen una muestra aleatoria de la poblacion de todos los ejecutivos. Use los 
datos para hallar un intervalo de confianza de 95% para la fraction de todos los ejecutivos corpora- 
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tivos que consideran que el flujo de caja es la medida mas importante de la salud financiera de una 
companfa. 

8.125 Suponga que muestras independientes de tamanos n l y se toman de dos poblaciones normalmente 
distribuidas con varianzas of y of, respectivamente. Si Sf y Sf denotan las varianzas muestrales respec- 
tivas, el Teorema 7.3 implica que («i — \)Sf/of y (n 2 — 1 )Sf/of tienen distribuciones x 2 con n 1 - 1 y 
n n - 1 grados de libertad, respectivamente. Ademas, estas variables aleatorias con distribucion x 2 son 
independientes porque las muestras se tomaron de manera independiente. 

a Utilice estas cantidades para construir una variable aleatoria que tenga una distribucion F con n,— 1 
grados de libertad en el numerador y n-, - 1 grados de libertad en el denominador. 
b Utilice la cantidad con distribucion F del inciso a como una cantidad pivote y deduzca una formula 
para un intervalo de confianza de 100(1 - a)% para of /of. 

8.126 Un fabricante farmaceutico compra materias primas de dos proveedores diferentes. El nivel medio de 
impurezas es aproximadamente el mismo para ambos proveedores, pero el fabricante esta preocupado 
por la variabilidad en la cantidad de impurezas de entre un embarque y otro. Si el nivel de impurezas 
tiende a variar en forma excesiva de una fuente de abastecimiento, esto podria afectar la calidad del 
producto final. Para comparer la variation en el porcentaje de impurezas para los dos proveedores, el 
fabricante selecciona diez envfos de cada uno de ellos y mide el porcentaje de impurezas de cada envfo. 
Las varianzas muestrales fueron sf = .273 y sf = .094 respectivamente. Forme un intervalo de confian¬ 
za de 95% para la relation entre las varianzas poblacionales reales. 

*8.127 Denote con Y la media de una muestra de tamano 100 tomada de una distribucion gamma con a = c 0 
conocida y f) desconocida. Demuestre que un intervalo de confianza aproximado de 100(1 - a)% para 
P esta dado por 

( _ i—, _i_V 

\ Co + .1 z b /2V^o Co - -Izc/is/c/) J 

*8.128 Suponga que tomamos una muestra de tamano n l de una poblacion normalmente distribuida con media 
y varianza p, 1 y of, y una muestra independiente de tamano n 2 de una poblacion normalmente distribui¬ 
da con media y varianza p, 2 y of. Si es razonable suponer que of = of, entonces se pueden aplicar los 
resultados dados en la Section 8.8. 

^Que se puede hacer si no podemos suponer que las varianzas desconocidas son iguales, pero tenemos 
la suerte de saber que of = kof para alguna constante conocida k # 1 ? Suponga, como hicimos antes, que 
las medias muestrales estan dadas por Y t y Y 2 y las varianzas muestrales por Sf y Sf, respectivamente. 


a Demuestre que Z* dada a continuation tiene una distribucion normal estandar. 


Z* = 


(Li ~Y 2 ) -(/ii -/* 2 ) 



b 


c 


Demuestre que W* dada a continuation tiene una distribucion x 2 con n i + n-, - 2 grados de libertad. 

(m -DSf+(n 2 -l)S 2 2 /k 


Observe que Z* y W* de los incisos a y b son independientes. Por ultimo, demuestre que 


y* — 


(Iti ~y 2 ) “(Mi -P2) 


n k 

s pJ~ + ~ 

V ”1 «2 


.. On - \)Sf + (n 2 - l)Sf/k 

donde 5: = - - --— 

p ni + n 2 — 2 
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tiene una distribucion t con n l + n 2 - 2 grados de libertad. 

d Utilice el resultado del inciso c para dar un intervalo de confianza 100(1 - a)% para /Xj - /x 2 , supo- 
niendo que cr 2 = kerf. 

e r,Que ocurre si k = 1 en las partes a-d? 

*8.129 En la Seccion 8.3 observamos que si 

E'U(^-n 2 .. „2_T,Uy,- y) 2 
° y ° , » 

n n — 1 

entonces S 2 es un estimador sesgado de cr 2 , pero S 2 es un estimador insesgado del mismo parametro. Si 
se toman muestras de una poblacion normal, 

a encuentre V(S 2 ), 

b demuestre que ViS 2 ) > V(S 2 ). 

*8.130 El Ejercicio 8.129 sugiere que S 2 es superior a S' 2 respecto al sesgo y que S' 2 es superior a S 2 porque po- 
see una varianza mas pequena. ^,Cual es mejor estimador? [Sugerencia: compare los errores cuadraticos 
medios.] 

*8.131 Consulte los Ejercicios 1.129y 1.130. S 2 y S' 2 son dos estimadores para cr 2 de la forma c Yl"=i(Yi ~ Y) 2 . 

^Que valor de c da el estimador para cr 2 con el error cuadratico medio mas pequeno entre todas las 
estimaciones de la forma c Y^=i(Yi ~ Y) 2 ? 

8.132 Consulte los Ejercicios 6.17 y 8.14. La funcion de distribucion para una distribucion de familia de po- 
tencias esta dada por 


F(y) 



1 , 


y <0, 

0 <y <0, 
y>8. 


donde a, 6 > 0. Suponga que se toma una muestra de tamano n de una poblacion con una distribucion 
de familia de potencias y que a — c donde c > 0 es conocida. 

a Demuestre que la funcion de distribucion de y (,0= maxj Y 1 ,Y 2 ,. .., Y n ] esta dada por 


Fy^y) 



1 , 


y < 0, 

0 <y <0, 

y >e. 


donde 0 > 0. 

b Demuestre que F (n) /6 es una cantidad pivote y que para 0 < k < 1 


P 




= 1 -k cn 


c Suponga que n = 5yo: = c = 2.4. 

i Use el resultado del inciso (b) para hallar k tal que 


P ^ifc < ^ < 1 j = 0.95. 


ii De un intervalo de confianza de 95% para 6. 
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8.1 33 Suponga que se seleccionan dos muestras aleatorias independientes de n l y n 2 observaciones de pobla- 
ciones normales. Ademas, suponga que las poblaciones poseen una varianza comun cr 2 . Sea 


'q. V/M-Y ') 2 

' m - l 


i = 1, 2. 


a Demuestre que S 2 , el estimador ponederado de cr 2 (que sigue), es insesgado: 


^ = ( Wl -l)S?+(» 2 -l)Sf 
p n\ + ri 2 ~ 2 

b Encuentre V(S 2 ). 

8.134 El intervalo de confianza de una muestra pequena para /x, basado en una t de Student (Seccion 8.8) 
posee una amplitud aleatoria, en contraste con el intervalo de confianza de una muestra grande (Seccion 
8.6), donde la amplitud no es aleatoria si se conoce cr 2 . Encuentre el valor esperado de la amplitud del 
intervalo en el caso de una muestra pequena si se desconoce cr 2 . 

8.135 Un intervalo de confianza es insesgado si el valor esperado del punto medio del intervalo es igual al 
parametro estimado. El valor esperado del punto medio del intervalo de confianza de una muestra grande 
(Seccion 8.6) es igual al parametro estimado y lo mismo es cierto para intervalos de confianza de una 
muestra pequena para /x y (/Xj - /u 2 ) (Seccion 8.8). Por ejemplo, el punto medio del intervalo y ±_ ts/sfn 
es y , y E(Y) = /x. Ahora considere el intervalo de confianza para a 2 . Demuestre que el valor esperado 
del punto medio de este intervalo de confianza no es igual a cr 2 . 

8.136 La media muestral Y es un buen estimador puntual de la media poblacional /x. Tambien se puede usar 
para predecir un valor futuro de Y seleccionado en forma independiente de la poblacion. Supongamos que 
usted tiene una media muestral Y y una varianza S 2 basada en una muestra aleatoria de n mediciones de 
una poblacion normal. Use la t de Student para formal' una cantidad pivote para hallar un intervalo de pre- 
diccion para algun nuevo valor de Y, por ejemplo Y , a ser observado en el futuro. [Sugerencia: empiece 
con la cantidad y p - _y.| Observe la terminologfa: los parametros son estimados; los valores de variables 
aleatorias son pronosticados. 
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puntuales y metodos 
de estimacion 


9.1 Introduccion 

9.2 Eficiencia relativa 

9.3 Consistencia 

9.4 Suficiencia 

9.5 Teorema de Rao-Blackwell y estimacion insesgada de varianza minima 

9.6 Metodo de momentos 

9.7 Metodo de maxima verosimilitud 

9.8 Algunas propiedades de los estimadores de maxima verosimilitud 
con muestras grandes (opcional) 

9.9 Resumen 

Bibliograffa y lecturas adicionales 


9.1 Introduccion 

En el Capitulo 8 presentamos algunos estimadores intuitivos para parametros que con fre- 
cuencia son de interes en problemas practicos. Un estimador 9 para un parametro objetivo 9 es 
una funcion de las variables aleatorias observadas en una muestra y, por tanto, tambien es una 
variable aleatoria. En consecuencia, un estimador tiene una distribution de probabilidad, la 
distribution muestral del estimador. Observamos en la Section 8.2 que, si E(6) = 9, entonces 
el estimador tiene la (a veces) deseable propiedad de ser insesgado. 

En este capitulo emprendemos un analisis mas formal y detallado de algunas de las propie¬ 
dades matematicas de estimadores puntuales, en particular las nociones de eficiencia, consis¬ 
tencia y suficiencia. Presentamos un resultado, el teorema de Rao-Blackwell, que proporciona 
un enlace entre los estadfsticos suficientes y los estimadores insesgados de los parametros. En 
terminos generales, un estimador insesgado con variation pequena es, o se puede hacer que 
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sea una funcion de un estadfstico suficiente. Tambien mostraremos un metodo que en oca- 
siones puede usarse para hallar estimadores insesgados de minima varianza para parametros 
de interes. A continuacion ofrecemos otros dos metodos utiles para obtener estimadores: el 
metodo de momentos y el metodo de maxima verosimilitud. Estudiamos algunas propiedades 
de estimadores obtenidas por estos metodos. 


9.2 Eficiencia relativa 

En general es posible obtener mas de un estimador insesgado para el mismo parametro ob- 
jetivo 0. En la Seccion 8.2 (Figura 8.3) mencionamos que si 0\ y fa denotan dos estimadores 
insesgados para el mismo parametro 0, preferimos usar el estimador con la varianza mas pe- 
quena. Esto es, si ambos estimadores son insesgados, fa es relativamente mas eficiente que fa 
si V(fa) > V(fa). De hecho, usamos la razon V(fa)/V(fa) para definir la eficiencia relativa 
de dos estimadores insesgados. 


DEFINICION 9.1 


Dados dos estimadores insesgados fa y fa de un parametro 0, con varianzas V(fa) y V(fa), 
respectivamente, entonces la eficiencia de fa con respecto a fa, denotada eff (fa, fa), se 
define como la razon 


eff (0i, fa) 


V(fa) 

V(A)' 


Si fa y fa son estimadores insesgados para 6, la eficiencia de fa con respecto a fa , eff ( fa, fa), 
es mayor que 1 solo si V(fa) > V (fa). En este caso fa es un mejor estimador insesgado que fa. 
Por ejemplo, si eff (@i, fa) = 1.8, entonces V(fa) = (1.8)V(@i) y fa se prefiere a fa. Del mis¬ 
mo modo, si eff (fa, fa) es menor que 1, por ejemplo .73, entonces V(fa) = (.1?>)V(0\) y fa se 
prefiere a fa. Consideremos un ejemplo en donde intervienen dos estimadores diferentes para 
una media poblacional. Suponga que deseamos estimar la media de una poblacion normal. 
Sea 0i la mediana muestral, la observacion central cuando las mediciones muestrales se orde- 
nan de acuerdo con la magnitud (n impar) o con el promedio de dos observaciones centrales 
(« par). Sea fa la media muestral. Aun cuando se omite la demostracion, se puede afirmar que 
la varianza de la mediana muestral, para n grande, es V(fa) = (1.2533) 2 (cr 2 /«). Entonces la 
eficiencia de la mediana muestral con respecto a la media muestral es 


eff (fa, fa) 


V(fa) 

nfa) 


a 2 /n 

(1.2533) 2 cr 2 /« 


1 

(1.2533) 2 


.6366. 


Entonces, vemos que la varianza de la media muestral es aproximadamente 64% de la varian¬ 
za de la mediana muestral. Por tanto, preferirfamos usar la media muestral como el estimador 
para la media poblacional. 
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EJEMPLO 9.1 


Solucion 


Sea Fj, F 2 , . . . , Y n una muestra aleatoria de una distribucion uniforme en el intervalo (0, 0). 
Dos estimadores insesgados para 0 son 

- „ (n + 1 \ 

0i =2Y y 0 2 = (— \Y ( n), 

cuando = max (Fj, F 2 ,. . ., Y n ). Encuentre la eficiencia de 9\ con respecto a 0 2 . 


En vista que cada Y l tiene una distribucion uniforme en el intervalo (0, 0), /J- = E ( Y : ) = 9 /2 y 
a 2 = V {Y t ) = 0 2 /12. Por tanto, 

E(6 X ) = E (2F) =2E(Y)=2(n) =2 (f) = 0, 


y es insesgada, como dijimos. Ademas, 

V(6i) = V(2 Y) =4 V(Y) =4 


V(Y,) 


n J V 12 / 3 n 


Para hallar la media y la varianza de 0 2 , recuerde (vea Ejercicio 6.74) que la funcion de 
densidad de esta dada por 

' (T /y 


g W (y) = n[F Y (y)] n - 1 f Y (y) = 


i)- 0SyS< ’’ 

en cualquier otro punto. 


Por tanto, 




y se deduce que £{[(«+ l)/n]F (n) } = 0; esto es, 0 2 es un estimador insesgado para 0. 
Como 

fB 




- f y n 

r Jo ' 


+1 — 


dy = 


n + 2 


6 2 , 


obtenemos 


V (F( ;l) ) = E(Y 2 n) ) - [£(F W )] Z = 


2 _ 


n 

( n V 

n + 2 

V» + iJ _ 


V(0 2 ) = V 


n + 1 


f(n) 


( n + \y 

n(n + 2) 


0 2 = 


n + 1 


0 2 


V(F W ) 


n(n + 2) 


Por tanto, la eficiencia de 9 X con respecto a 0 2 esta dada por 


eff (@i, 0 2 ) 


V(0 2 ) 

v<A) 


0 2 /[n(n + 2)] 
0 2 /3n 


3 

n + 2 


Esta eficiencia es menor que 1 si n > 1. Es decir, si n > 1, 02 tiene una varianza menor que 0|, 
y por tanto 0 2 es en general preferible a 0i como estimador de 0. ■ 
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Mas adelante en este capftulo presentamos algunos metodos para hallar estimadores con 
varianzas mas pequenas. Por ahora deseamos solo senalar que la eficiencia relativa es un cri- 
terio importante para comparar estimadores. 


Ejercicios 


9.1 


En el Ejercicio 8.8 consideramos una muestra aleatoria de tamano 3 de una distribucion exponencial con 
funcion de densidad dada por 


f(y) 


(1 / 6 )e~ y/e , 0 <y, 

0, en cualquier otro punto. 


y determinamos que 8 t = Yi,d 2 = (Pi + E 2 )/2,(1 3 = (E, + 2Y 2 )/3 y 85 = Y son todos ellos estimadores 
insesgados para 8 . Encuentre la eficiencia de con respecto a 85 , de 62 con respecto a y de 0 3 con 
respecto a 0 5 . 

9.2 Sean E l5 Y 2 , . . . , Y n que denotan una muestra aleatoria de una poblacion con media /x y varianza a 2 . 
Considere los siguientes tres estimadores para /x: 


£1 = ^ +Y 2 ), 


1 E> + 

£9 = -Y 1 + —- 

^ 4 2 (n - 2) 


+ Y „-1 1 

+ -Y 

+ 4 r,„ 


£3 = E. 


a Demuestre que cada uno de los tres estimadores es insesgado. 
b Encuentre la eficiencia de £ 3 con respecto a £ 2 y £ 1 , respectivamente. 

9.3 Suponga que E,, Y 2 , , Y„ denotan una muestra aleatoria de una distribucion uniforme en el intervalo 

(0, 6 + 1). Sean 


a Demuestre que tfi y 8 2 son estimadores insesgados de 6 . 
b Encuentre la eficiencia de #1 con respecto a 0 2 . 

9.4 Suponga que , Y n denotan una muestra aleatoria de tamano n de una distribucion uniforme en el 

intervalo (0, 6). Si y (D = mm(Ej, F„ ..., Y n ), el resultado del Ejercicio 8.18 indica que 6i = (n + 1)E(d 
es un estimador insesgado para 8 . Si = max(Ej, Y 2 , ..., Y n ), los resultados del Ejemplo 9.1 implican 
que § 2 = [(n + 1 )/n~\Y{ n) es otro estimador insesgado para 0. Demuestre que la eficiencia de 8\ con 
respecto a 9 2 es l/n 2 . Observe que esto implica que d 2 es un estimador marcadamente superior. 

9.5 Suponga que Y i , Y 2 ,. . ., Y n es una muestra aleatoria de una distribucion normal con media /u. y varianza 
cr 2 . Dos estimadores insesgados de cr 2 son 


= S 2 = -- J2(Y t - Y ) 2 

n — 1 


&2 = ^(Pl - P 2 ) 2 . 


Encuentre la eficiencia de & 2 con respecto a & 2 ■ 


9.6 Suponga que Ej, Y 2 , . . . , Y n denotan una muestra aleatoria de tamano n de una distribucion de Poisson 
con media A. Considere Aj = (Ej +E>)/2yA2 = E. Deduzca la eficiencia de A 1 con respecto a At. 

9.7 Suponga que E l5 E 2 , . . ., Y n denotan una muestra aleatoria de tamano n de una distribucion exponencial 
con funcion de densidad dada por 


f(y ) = 


(l/ 8 )e- y/e , 0 <y, 

0, en cualquier otro punto. 
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En el Ejercicio 8.19 determinamos que d\ = «E(i) es un estimador insesgado de 8 con MSE(0|) = 8 2 . 
Considere el estimador 8i = Y y encuentre la eficiencia de 8\ con respecto a d 2 . 

*9.8 Denote con Y } , Y 2 , . . . , Y n una muestra aleatoria de una funcion de densidad de probabilidad/(y) que 
tiene parametro 6 desconocido. Si 9 es un estimador insesgado de 8, entonces en condiciones muy gene- 
rales 

V(8)>I(8), donde 1(8) — 

(Esto se conoce como la desigualdad de Cramer-Rao.) Si V(6) = 1(9), se dice que el estimador 8 es 
eficiente . 1 

a Suponga que/(v) es la densidad normal con media p, y varianza a 2 . Demuestre que Y es un estimador 
eficiente de p. 

b Esta desigualdad tambien se cumple para funciones de probabilidad discretas p (y). Suponga quep (y) es 
la funcion de probabilidad de Poisson con media A. Demuestre que Y es un estimador eficiente de A. 



9.3 Consistencia 

Suponga que una moneda, que tiene probabilidad p de resultar en cara, se lanza al aire n ve- 
ces. Si los tiros son independientes, entonces Y, el numero de caras entre los n tiros, tiene una 
distribucion binomial. Si el valor verdadero de p es desconocido, la proporcion muestral Y/n 
es un estimador de p. iQue le ocurre a esta proporcion muestral cuando aumenta el numero 
de tiros nl Nuestra intuicion nos lleva a pensar que cuando n aumenta, Y/n debe acercarse 
al verdadero valor de p. Esto es, cuando aumenta la cantidad de information en la muestra, 
nuestro estimador debe acercarse a la cantidad que valoramos. 

La Figura 9.1 ilustra los valores d e p = Y/n para una sola sucesion de 1000 intentos de 
Bernoulli cuando el verdadero valor de p es .5. Observe que los valores de p convergen alrededor 
de .5 cuando el numero de intentos es pequeno pero se aproximan y permanecen muy cerca de 
p = .5 cuando aumenta el numero de intentos. 

La sucesion individual de 1000 intentos ilustrada en la Figura 9.1 resulto (para n mas gran¬ 
de) en valores para la estimacion que fueron muy cercanos al verdadero valor, p = .5. qOtras 
sucesiones darfan resultados similares? La Figura 9.2 muestra los resultados combinados de 
50 sucesiones de 1000 intentos. Observe que las 50 sucesiones distintas no eran identicas. 
Mas bien, la Figura 9.2 muestra una “convergencia” de clases en el valor real p = .5. Esto 
se ilustra por medio de una dispersion mas amplia de los valores de las estimaciones para 
numeros de intentos mas pequenos, pero una dispersion mucho mas angosta de los valores 
de las estimaciones aparece cuando el numero de intentos es mas grande. ^Observaremos 
este mismo fenomeno para diferentes valores de pi Algunos de los ejercicios que se en- 
cuentran al final de esta seccion le permitiran usar aplicaciones practicas (disponibles en 
www.thomsonedu.com/statistics/wackerly) para explorar mas a fondo por st solo. 

(■,C6mo podemos expresar tecnicamente el tipo de “convergencia” exhibido en la Figura 
9.2? Como Y/n es una variable aleatoria, podemos expresar esta “cercama” a p en terminos 
probabilfsticos. En particular, examinemos la probabilidad de que la distancia entre el estima¬ 
dor y el parametro objetivo, | (Y/n) -p |, sera menor que algiin numero real s positivo arbitra- 


1. Los ejercicios precedidos por un asterisco son opcionales. 
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FIGURA 9.1 

Valores de p = Y / n 
para una sucesion 
individual de 1000 
ntentos de Bernoulli, 
p = .5 


Estimacion de p 



FIGURA 9.2 

Valores de p = Y/n 
para 50 sucesiones 
de 1000 i ntentos de 
Bernoulli, p = .5 


Estimacion de p 

1.00 i- 


.75 


.50 


.25 


.00 


Intentos 



rio. La Figura 9.2 parece indicar que esta probabilidad pudiera ser creciente a medida que n se 
hace mas grande. Si nuestra intuicion es correcta y n es grande, esta probabilidad, 


P 


Y 

n 


debe ser cercana a 1. Si esta probabilidad de hecho tiende a 1 cuando n —* oo, entonces 
decimos que (Y/n) es un estimador consistente de p, o que (Y/n) “converge en probabilidad 
en p”. 
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DEFINICION 9.2 


TEOREMA 9.1 


Demostracion 


Se dice que el estimador 9 n es un estimador consistente de 9 si, para cualquier numero 
positivo e, 

lfm P(\e„ -0\ <e) = 1 

n —> cx) 

o bien, de forma equivalente, 

lfm P(\9 n - 6\ > e) = 0. 


La notacion 0„ expresa que el estimador para 0 se calcula usando una muestra de tamano 
n. Por ejemplo, IL es el promedio de dos observaciones mientras que Y mo es el promedio de 
las 100 observaciones contenidas en una muestra de tamano n = 100. Si 9 n es un estimador 
insesgado, el siguiente teorema se puede utilizar a menudo para demostrar que el estimador es 
consistente. 


Un estimador insesgado 9 n para 9 es un estimador consistente de 9 si 

lfm V(9 n ) = 0. 


Si Y es cualquier variable aleatoria con E (Y) = /jl y V (Y) = a 2 < oo y si k es cualquier 
constante no negativa, el teorema de Tchebysheff (vease el Teorema 4.13) implica que 

P(\Y -/ a | > ka)s 

Como 9„ es un estimador insesgado para 9, se deduce que E <B„) = 9. Seacr^ = V V(9 „) 
que denota el error estandar del estimador 9„. Si aplicamos el teorema de Tchebysheff 
para la variable aleatoria 9„, obtenemos 

P(\&n~0\>ko K )<^. 


Sea n cualquier tamano muestral fijo. Para cualquier numero positivo e, 


e 

k = — 


es un numero positivo. La aplicacion del teorema de Tchebysheff para esta n fija y esta 
seleccion de k muestra que 

\ 1 _ V(9 n ) 

V~(s/a s f « 2 ' 


P(\9„ -9\>e) = P ( \9„-9\> 
Entonces, para cualquier n fija, 


O<P(|0„ -9\ >e) 
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EJEMPLO 9.2 


Solucion 


TEOREMA 9.2 


Si lfm )I-00 V ( 8 n ) = 0 y tomamos el limite cuando n —* oo de la sucesion de proba- 
bilidades anterior, 

lfm (0) < lfm P(\§n — 01 > e) < lfm —— = 0. 

n—> oo n —>oo ' 1 1 ' w—» oo 

Entonces, 6 n es un estimador consistente para 9. 


La propiedad de consistencia dada en la Definition 9.2 y presentada en el Teorema 9.1 
comprende un tipo particular de convergencia de 6„ en 9. Por esta razon, el enunciado “Q n es un 
estimador consistente para 9” se sustituye a veces con el enunciado equivalente “9 n converge 
en probabilidad en 9.” 


Sea Y ] ,Y 2 ,..., Y n que representan una muestra aleatoria de una distribution con media /jl y varian- 
za cr < oo. Demuestre que Y„ = ^ ^ es un estimador consistente de fi. ( Nota: usamos la 

notacion Y„ para indicar explfcitamente que Y se calcula usando una muestra de tamano n.) 

Sabemos de capftulos anteriores que E{Y„) = /jl y V(Y„) = a 2 /n. Como Y,, es insesgado 
para /j,y V(Y n ) ^>0 cuando n —> oo, el Teorema 9.1 establece que Y,, es un estimador consis¬ 
tente de fji. Analogamente, podemos decir que Y,, converge en probabilidad en /jl. 

A1 hecho de que Y,, sea consistente para /jl, o converge en probabilidad en /i, se le conoce 
a veces como la ley de los grandes numeros. Esta proporciona la justificacion teorica para el 
proceso de promediar que se emplea en numerosos experimentos para obtener precision en las 
mediciones. Por ejemplo, un experimentador puede tomar el promedio de los pesos de muchos 
animales para obtener una estimacion mas precisa del promedio de peso de animales de esta 
especie. La idea del experimentador, confirmada por el Teorema 9.1, es que el promedio de 
muchos pesos seleccionados de manera independiente debe ser muy cercano al verdadero peso 
medio con probabilidad alta. ■ 


En la Section 8.3 consideramos un estimador intuitivo para /j. - /x 2 , la diferencia en las 
medias de dos poblaciones. El estimador estudiado esa vez fue Tj — Yt, la diferencia en 
las medias de muestras aleatorias independientes seleccionadas de entre dos poblaciones. Los 
resultados del Teorema 9.2 seran muy utiles para establecer la consistencia de tales estima- 
dores. 


Suponga que 9„ converge en probabilidad en 9 y que 9' n converge en probabilidad en 9'. 

a 9 n + fP converge en probabilidad en 9 + 9'. 
b 0„ X 9' n converge en probabilidad en 9x9'. 
c Si 9' t 4 0, 9 n /9' n converge en probabilidad en 9/9'. 

d Si g (■) es una funcion de valor real que es continua en 9 , entonces g (9„) converge en 
probabilidad en g (9). 
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La demostracion del Teorema 9.2 se asemeja mucho a la demostracion correspondiente en 
el caso donde { a n } y { b n } son sucesiones de numeros reales que convergen en limites reales a 
y b, respectivamente. Por ejemplo, si a n —> a y b n —> b entonces 

+ b „ a + b. 


EJEMPLO 9.3 


Suponga que Y x , Y 2 ,..., Y n representan una muestra aleatoria tal que E (I') = /x, E(Yf) = /x) 
y E{Yf) = son todas finitas. Demuestre que 


Si = 


»4rDr 


Y n f 


es un estimador consistente de cr 2 = V(Y-). (Nota: usamos el submdice n en S 2 v en K para dar 
a entender explicitamente su dependencia del valor del tamano muestral n.) 


Solucion Hemos visto ya en capftulos anteriores que S 2 , que ahora se escribe como S^, es 


S 


2 

n 




El estadistico (1 jn) \ Y 2 es el promedio de n variables aleatorias independientes y dis- 
tribuidas identicamente, con E(Yf) = /ii y V(Y 2 ) = jj_' 4 — (/jl' 2 ) 2 < oo ■ P° r ' a ley de los 
grandes numeros (Ejemplo 9.2), sabemos que (1 /n) YTi=\ Y} converge en probabilidad a /x). 

El Ejemplo 9.2 tambien implica que Y n converge en probabilidad en /x. Como la funcion 
g (x) = x 2 es continua para todos los valores finitos de x, el Teorema 9.2(d) implica que Y n 
converge en probabilidad en /x 2 . Se deduce entonces del Teorema 9.2(a) que 



converge en probabilidad en /x, — /x 2 = cr 2 . Como nj(n — 1) es una sucesion de constantes 
que convergen en 1 cuando n —* oo, podemos concluir que S' 2 converge en probabilidad en cr. 
Analogamente, .Sj 2 , la varianza muestral, es un estimador consistente para cr 2 , la varianza po- 
blacional. ■ 


En la Seccion 8.6 consideramos intervalos de confianza de una muestra grande para algu- 
nos parametros de interes practico. En particular, si Tj, Y 2 ,..., Y n es una muestra aleatoria de 
cualquier distribucion con media /x y varianza cr 2 , establecimos que 

F±z “ /2 fe) 

es un intervalo de confianza valido de una muestra grande con coeficiente de confianza aproxi- 
madamente igual a (1 - a). Si cr 2 se conoce, este intervalo puede y debe calcularse. No obstan¬ 
te, si cr 2 no se conoce pero el tamano muestral es grande, recomendamos sustituir S por cr en 
el calculo porque esto no ocasiona una perdida significativa de exactitud. El siguiente teorema 
proporciona la justificacion teorica para estas afirmaciones. 
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TEOREMA9.3 Suponga que U n tiene una funcion de distribucion que converge en una funcion de distri¬ 
bucion normal estandar cuando n —» oo. Si W n converge en probabilidad en 1, entonces 
la funcion de distribucion de U n /W n converge en una funcion de distribucion normal 
estandar. 


Este resultado se deduce de un resultado general conocido como teorema de Slutsky 
(Serfling, 2002). La demostracion de este resultado esta fuera del proposito de este libro, pero 
la utilidad del resultado se ilustra en el siguiente ejemplo. 


EJ EMPLO 9.4 Suponga que Y v Y 2 , , Y n es una muestra aleatoria de tamano n de una distribucion con 

E (Yl) = jj. y V (Y/) = a 2 . Defina S 2 como 


S 2 = 


rrE( y i- ? * 

i =1 


) 2 - 


Demuestre que la funcion de distribucion de 



converge en una funcion de distribucion normal estandar. 


Solucion En el Ejemplo 9.3, demostramos que S 2 converge en probabilidad en cr 2 . Observe que g (x) = 
+Vx/c es una funcion continua de x si x y c son positivas. Por tanto, se deduce del Teorema 
9.2(d) que S n /a = +y/S 2 /cr 2 converge en probabilidad en 1. Tambien sabemos del teorema 
del li'mite central (Teorema 7.4) que la funcion de distribucion de 

tt ^ /— ( Y n ~ H- 

U„ =V« - 

\ ^ 

converge en una funcion de distribucion normal estandar. Por tanto, el Teorema 9.3 implica 
que la funcion de distribucion de 

converge en una funcion de distribucion normal estandar. ■ 


El resultado del Ejemplo 9.4 indica que, cuando n es grande, y'Td Y n — /jl) / S n tiene aproxi- 
madamente una distribucion normal estandar cualquiera que sea la forma de la distribucion 
de la que se tome la muestra. Si la muestra se toma de una distribucion normal, los resultados 
del Capitulo 7 implican que t = y/n(Y n — /x) /S„ tiene una distribucion t con n - 1 grados de 
libertad (gl). Combinando esta informacion, vemos que si una muestra grande se toma de una 
distribucion normal, la funcion de distribucion de t = \/n( Y n — / 'jl)/S„ puede ser aproximada 
por una funcion de distribucion normal estandar. Esto es, cuando n se hace grande y por tanto 
cuando el numero de grados de libertad es grande, la funcion de distribucion t converge en la 
funcion de distribucion normal estandar. 
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Si obtenemos una muestra grande de cualquier distribucion, sabemos del Ejemplo 9.4 que 
— /jl) /S„ tiene aproximadamente una distribucion normal estandar. Por tanto, se de¬ 
duce que 


P 


-Z a /2 


Yn~H 

s„ 


^ Za/2 


~ 1 — a. 


Si manipulamos las desigualdades del enunciado de probabilidad para aislar \i en el centra, 
obtenemos 


P 



< p < Y„ + Za/2 



~ 1 — a. 


Por tanto, Y„ ± z a / 2 (S„/\/n ) forma un intervalo de confianza de muestra grande valido para 
Ia , con coeficiente de confianza aproximadamente igual a 1 - a. Del mismo modo, el Teorema 
9.3 se puede aplicar para demostrar que 


Pn 



es un intervalo de confianza valido con una muestra grande para p con coeficiente de confianza 
aproximadamente igual a 1 — a. 

En esta seccion hemos visto que la propiedad de consistencia es un indicador de la distan- 
cia entre un estimador y la cantidad que se estima. Hemos visto que cuando el tamano mues- 
tral es grande, Y n es cercana a /jl y S/ es cercana a cr 2 , con una probabilidad alta. Mas adelante 
en este capftulo veremos otros ejemplos de estimadores consistentes. 

En esta seccion utilizamos la notacion Y n , S 2 , p n y, en general, 9 n para dar a entender explf- 
citamente la dependencia de los estimadores respecto del tamano muestral n. Necesitabamos 
hacerlo asf porque estabamos interesados en calcular 

Ifm P(\9 n — 6\ < e). 


Si este lfmite es igual a 1, entonces 0 n es un estimador “consistente” para 9 (mas precisamen- 
te, 9 n es una sucesion de estimadores consistente para 6). Desafortunadamente, esta notacion 
hace que nuestros estimadores se vean demasiado complejos. De aquf en adelante, volvere- 
mos a utilizar la notacion 9 como nuestro estimador para 9 y no mostraremos explfcitamente la 
dependencia del estimador en n. La dependencia de 0 respecto del tamano muestral n siempre 
es implfcita y debe tomarse en cuenta cuando se considere la consistencia del estimador. 


Ejercicios 

9.9 Ejercicio Applet ^Como se obtuvo la Figura 9.1? Entre a la aplicacion breve PointSingle en 
www.thomsonedu.com/statistics/wackerly. La aplicacion superior va a generar una sucesion de intentos 
de Bernoulli [X i =1,0 con pi 1) = p,p{ 0) = 1 -p] con p = .5, un escenario equivalente a sucesivamente 
lanzar al aire una moneda balanceada. Sea Y„ — ^/" =l X, = el numero de unos (1) en los primeros n 
intentos y p n = Y n ln■ Para cada n, la aplicacion calcula p n y la grafica contra el valor de n. 

a Si p 5 = 2/5, i,que valor de X 6 resultara en p 6 > p 5 ? 

b Haga clic en el boton “One Trial” una sola vez. Su primera observation es 0 o 1. ^Que valor obtuvo? 
^,Cual fue el valor de /q? Haga clic en el boton “One Trial” varias veces mas. ^Cuantos intentos n ha 









Ejercicios 455 


simulado? ^Que valor de p n observo? ^E1 valor es cercano a .5, el valor real de pi ^La grafica es una 
lrnea horizontal plana? ^Por que si o por que no? 

c Haga clic en el boton “100 Trials” una sola vez. (j Que observa? Haga clic en el boton “100 Trials” 
repetidas veces hasta que el numero total de intentos sea 1000. ^La grafica que obtuvo es identica a 
la dada en la Figura 9.1 ? ^En que sentido es semejante a la grafica de la Figura 9.1? 
d Con base en la muestra de tamano 1000, ^cual es el valor de piooo? t,Este valor es lo que esperaba 
observar? 

e Haga clic en el boton “Reset”. Haga clic en el boton “100 Trials” diez veces para generar otra suce¬ 
sion de valores para p. Comentelo. 

9.10 Ejercicio Applet Consulte el Ejercicio 9.9. Arrastre el cursor a la parte de la pantalla marcada “Try 
different probabilities”. Use el boton marcado “p =” de la esquina inferior derecha de la pantalla para 
cambiar el valor de p a un valor que no sea .5. 

a Haga clic en el boton “One Trial” unas cuantas veces. r,Que observa? 

b Haga clic en el boton “100 Trials” unas cuantas veces. ^Que observa acerca de los valores de p„ 
cuando el numero de intentos se hace mas grande? 

9.11 Ejercicio Applet Consulte los Ejercicios 9.9 y 9.10. (j C6mo se pueden graficar simultaneamente los 
resultados de varias sucesiones de intentos de Bernoulli? Entre a la aplicacion PointbyPoint. Arrastre el 
cursor hasta que pueda ver los seis botones bajo la grafica superior. 

a No cambie el valor preestablecido de p = .5. Haga clic en el boton “One Trial” unas cuantas veces 
para verificar que este obteniendo un resultado semejante a los obtenidos en el Ejercicio 9.9. Haga 
clic en el boton “5 Trials” hasta que haya generado un total de 50 intentos. ^Cual es el valor de p 50 
que obtuvo al final de esta primera sucesion de 50 intentos? 
b Haga clic en el boton "New Sequence”. El color de su grafica inicial cambia de rojo a verde. Haga 
clic en el boton “5 Trials” unas cuantas veces. ^Que observa? ^La grafica es igual a la que observo en 
el inciso a? ^En que sentido es similar? 

c Haga clic en el boton “New Sequence”. Genere una nueva sucesion de 50 intentos. Repita hasta que 
haya generado cinco sucesiones. ^Las trayectorias generadas por las cinco sucesiones son identicas? 
^En que sentido son similares? 

9.12 Ejercicio Applet Consulte el Ejercicio 9.11. <,Que ocurre si cada sucesion es mas larga? Arrastre el 
cursor a la parte de la porcion marcada “Longer Sequences of Trials”. 

a Repita las instrucciones en los incisos a-c del Ejercicio 9.11. 

b iQue espera que ocurra si p no es 0.5? Use el boton de la esquina inferior derecha para cambiar el 
valor de p. Genere varias sucesiones de intentos. Comentelo. 

9.1 3 Ejercicio Applet Consulte los Ejercicios 9.9-9.12. Entre a la aplicacion Point Estimation. 

a Seleccione un valor para p. Haga clic en el boton “New Sequence” repetidas veces. ^.Que observa? 
b Arrastre el cursor a la parte de la aplicacion marcada “More Trials”. Seleccione un valor para p y 
haga clic en el boton “New Sequence” repetidas veces. Obtendra hasta 50 sucesiones, cada una ba- 
sada en 1000 intentos. ^Como cambia la variabilidad entre las estimaciones en funcion del tamano 
muestral? ^Como se manifiesta esto en la pantalla que obtuvo? 

9.14 Ejercicio Applet Consulte el Ejercicio 9.13. Arrastre el cursor a la parte de la aplicacion marcada 
“Mean of Normal Data”. Valores sucesivos observados de una variable aleatoria normal estandar pueden 
generarse y emplearse para calcular el valor de la media muestral Y„. Estos valores sucesivos se grafican 
entonces contra el tamano muestral respectivo para obtener una “trayectoria muestral”. 
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a ^Espera usted que los valores de Y n se agrupen alrededor de algun valor en particular? ^Que valor? 
b Si se grafican los resultados de 50 trayectorias muestrales, ^como espera que cambie la variabilidad 
de las estimaciones en funcion del tamano muestral? 
c Haga clic en el boton “New Sequence” varias veces. ^Observo lo que esperaba con base en sus res- 
puestas a los incisos a y b? 

9.15 Consulte el Ejercicio 9.3. Demuestre que 8 { y 0 2 son estimadores consistentes para 8. 

9.16 Consulte el Ejercicio 9.5. i& 2 es un estimador consistente de cr 2 ? 

9.17 Suponga que Aj, X 2 , . . . , X n y ¥j, Y 2 , . . . , Y n son muestras aleatorias independientes provenientes de 
poblaciones con medias /jl 1 y /jl 2 y varianzas of y of, respectivamente. Demuestre que X — Y es un 
estimador consistente de - p, 2 . 

9.18 En el Ejercicio 9.17 suponga que las poblaciones estan distribuidas normalmente con of = of = a 2 . 
Demuestre que 

T!U(x, -X ) 2 + ZU(Y, ~Y ) 2 

2 n -2 

es un estimador consistente de cr. 

9.19 Sea Y V Y 2 , ... ,Y n una muestra aleatoria de la funcion de densidad de probabilidad 


f(y) 


0y e ~', 0< y< 1, 

0, en cualquier otro punto. 


donde 0 > 0. Demuestre que Y es un estimador consistente de 0/(0 + 1). 

9.20 Si Y tiene una distribucion binomial con n intentos y probabilidad de exito p, demuestre que Y/n es un 
estimador consistente de p. 

9.21 Sea If. Y 2 , . . . , Y„ una muestra aleatoria de tamano n de una poblacion normal con media /jl y varianza 
a 2 . Suponiendo que n = 2k para algun entero k, un posible estimador para a 2 esta dado por 


-S±<r*-r„r. 


a Demuestre que a 2 es un estimador insesgado para cr 2 . 
b Demuestre que cr 2 es un estimador consistente para cr 2 . 

9.22 Consulte el Ejercicio 9.21. Suponga que Y v Y 2 , . . . ,Y n es una muestra aleatoria de tamano n de una 
poblacion con distribucion de Poisson con media A. De nuevo, suponga que n = 2k para algun entero k. 
Considere 

A = iX>'- 5/2 '-') 2 - 
1=1 

a Demuestre que A es un estimador insesgado para A. 
b Demuestre que A es un estimador consistente para A. 

9.23 Consulte el Ejercicio 9.21. Suponga que Y t , Y 2 , . . . ,Y n es una muestra aleatoria de tamano n de una 
poblacion para la cual los primeros cuatro momentos son finitos. Esto es, raj = £(Ti) < oo, m 2 = 
E(Y 2 ) < oo, raj =_E(}f)<oo y raj = E(Y^) < oo. (Nota: esta suposicion es valida para las distri- 
buciones normal y de Poisson en los Ejercicios 9.21 y 9.22, respectivamente.) De nuevo, suponga que 
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n = 2k para algun entero k. Considere 


* 2 = 9 , 5>-- y -') 2 


a Demuestre que a 2 es un estimador insesgado para cr 2 . 
b Demuestre que a 2 es un estimador consistente para cr 2 . 
c j,Por que fue necesaria la suposicion de que m\ — E{Y*) < oo? 

9.24 Sean Fj, F 2 , F 3 , . . . , F„ variables aleatorias normales estandar independientes. 
a j,Cual es la distribucion de T^" =l F 2 ? 

b Sea W„ = 1 i F 2 - converge en probabilidacl en alguna constante? Si es asf, j,cual es el valor 
de la constante? 


9.25 Suponga que Fj, Y 2 ,. . . , Y n denotan una muestra aleatoria de tamano n de una distribucion normal con 
media p y varianza 1. Considere la primera observacion Fj como un estimador para p. 

a Demuestre que Y 1 es un estimador insesgado para p. 
b Encuentre P (|Fj - p\ < 1). 

c Vea la definicion basica de consistencia dada en la Definicion 9.2. Con base en el resultado del inciso 
b, iY 1 es un estimador consistente para pi 

*9.26 En ocasiones es relativamente facil establecer consistencia o falta de consistencia si se apela directa- 
mente a la Definicion 9.2, evaluando P(\8„ — 0 | < e) de manera directa y luego demostrando que 
h'm„^oo P( 1 8„ — 8 1 £ e) = 1 . Sea Y v F 2 ,..., Y n una muestra aleatoria de tamano n de una distribucion 
uniforme en el intervalo (0, 8). Si = max (F l5 F 2 , . . . , F n ), demostramos en el Ejercicio 6.74 que la 
funcion de distribucion de probabilidad de esta dada por 


(y) 


0, y < 0, 

(yW) n , O<y<0, 
1, y > 8. 


a Para cada n > 1 y toda e > 0, se deduce que P(|F ( „) — d\ < e) = P(d - e < Y (nj < 8 +s). Si 
e > 8, verifique que P (8 — e £ Y(„) < 8 + e) = 1 y que, para toda s < 8 positiva, obtenemos 
P(8 - e < F (n) < 8 + e) = 1 - [(8 - s)/8]". 

b Usando el resultado del inciso a, demuestre que es un estimador consistente para 8 al demostrar 
que, para toda e > 0, lfm,,^^, P(|F(„j — 0| < e) = 1. 


*9.27 


Use el metodo descrito en el Ejercicio 9.26 para demostrar que, si y a) = min (Fj, F„ . . . , Y n ) cuando 
Fn F 2 ,. . . , F„ son variables aleatorias uniformes e independientes en el intervalo (0, 8 ). entonces P(D no 
es un estimador consistente para 6. [Sugerencia: con base en los metodos de la Seccion 6.7, F (1) tiene la 
funcion de distribucion 


F( i)(F) 


0. y<0, 

1 — (1 — y/6) n , 0 <y<8, 

i. y>o.\ 


*9.28 Sea Fj, F 2 , . . . , F„ una muestra aleatoria de tamano n de una distribucion de Pareto (vease el Ejercicio 
6.18). Entonces los metodos de la Seccion 6.7 implican que P(D = nun (Fj, F 2 , . . . , F„) tiene la funcion 
de distribucion dada por 


^( 1)00 


0, y <£, 

l-03/y)“", y >13. 


Use el metodo descrito en el Ejercicio 9.26 para demostrar que y (b es un estimador consistente de /3. 
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*9.29 Sea Y v Y 2 , . . ., Y n una muestra aleatoria de tamano n de una distribucion de familia de potencias (vease 
el Ejercicio 6.17). Entonces los metodos de la Section 6.7 implican que *00 = max (Fj, Y 2 ,..., Y n ) tiene 
la funcion de distribution dada por 


F(, o(y) 


0, y < 0, 

(y/d) an , O<y<0, 

1, y >6. 


Use el metodo descrito en el Ejercicio 9.26 para demostrar que y w es un estimador consistente de 6. 

9.30 Sean F I5 F 2 ,. . . , Y n variables aleatorias independientes, cada una con funcion de densidad de probabili- 
dad 


/(y) 


3y 2 , 0<y<l, 

0, en cualquier otro punto. 


Demuestre que F converge en probabilidad en alguna constante y determine la constante. 

9.31 Si Fj, F„ . . . , Y n denotan una muestra aleatoria de una distribucion gamma con parametros ay j3, de¬ 
muestre que F converge en probabilidad en alguna constante y determine la constante. 

9.32 Sea F,, Y 2 , . . . , Y n una muestra aleatoria de la funcion de densidad de probabilidad 


/ O') 


2 

y 2 ’ 


o, 


^ 2 , 

en cualquier otro punto. 


^La ley de grandes numeros aplica a F en este caso? ^Por que si o por que no? 

9.33 Un experimentador desea comparar los numeros de bacterias de tipos A y B en muestras de agua. Se 
toma un total de n muestras de agua independientes y se hacen las cuentas para cada muestra. Sea X t 
el niimero de bacterias tipo A y Y. el numero de bacterias tipo B para la muestra i. Suponga que los 
dos tipos de bacterias estan distribuidos escasamente dentro de una muestra de agua, de modo que 
X 2 ,... ,X n y Y 1 ,Y 2 ,... ,Y n se pueden considerar muestras aleatorias independientes de distribuciones de 
Poisson con medias Aj y A 2 , respectivamente. Sugiera un estimador de Aj/(Aj + A 2 ). ^Que propiedades 
tiene el estimador propuesto por usted? 

9.34 La funcion de densidad de Rayleigh esta dada por 


f(y) 



y > 0, 


0, en cualquier otro punto. 


En el Ejercicio 6.34(a), usted establecio que F 2 tiene una distribucion exponencial con media 0. Si Fj, F 2 , 
. . . , Y n denotan una muestra aleatoria de una distribucion de Rayleigh, demuestre queVF„ = ^ Y^=i 
es un estimador consistente para 6. 

9.35 Sean Fj, F 2 ,... una sucesion de variables aleatorias con E (5j) = fi y V(Y t ) = af. Observe que las erf 
no son todas iguales. 

a iCuales£(F„)? 
b iCuales V(F„)? 

c ^En que condition (en las of) puede aplicarse el Teorema 9.1 para demostrar que F„ es un estimador 
consistente para /x? 

9.36 Suponga que F tiene una distribucion binomial con base en n intentos y probabilidad de exito p. Entonces 
p n = F/n es un estimador insesgado de p. Use el Teorema 9.3 para demostrar que la distribucion de 
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(p„ — p)/\ / p n q,,/n converge en una distribution normal estandar. [Sugerencia: escriba Y como lo hici- 
mos en la Section 7.5.] 


9.4 Suficiencia 

Hasta aquf hemos seleccionado estimadores con base en la intuition. Por tanto, elegimos 
Y y S 2 como los estimadores de la media y la varianza, respectivamente, de la distribucion 
normal. ( Parece que estos deben ser buenos estimadores de los parametros poblacionales.) 
Hemos visto que en ocasiones es mas conveniente usar estimadores insesgados. De hecho, se 
ha demostrado que Y y S 2 son estimadores insesgados de la media poblacional /jl y la varianza 
cr 2 , respectivamente. Observe que hemos empleado la information en una muestra de tamano 
n para calcular el valor de dos estadfsticos que funcionan como estimadores para los parame¬ 
tros de interes. En esta etapa los valores muestrales reales ya no son importantes; mas bien, 
resumimos la information de la muestra que se relaciona con los parametros de interes al usar 
los estadfsticos Y y S 2 . ( ,Este proceso de resumir o reducir los datos a los dos estadfsticos Y y 
S 2 conserva toda la information acerca de p, y cr 2 en el conjunto original de n observaciones 
muestrales? O bien, j se ha perdido u ocultado alguna information acerca de estos parametros 
en el proceso de reducir los datos? En esta section presentamos metodos para hallar estadfsti¬ 
cos que en cierto sentido resumen toda la information de una muestra acerca de un parametro 
objetivo. Se dice que estos estadfsticos tienen la propiedad de suficiencia o, dicho en una 
forma mas sencilla, reciben el nombre de estadisticos suficientes. Como veremos en la si- 
guiente section, “buenos” estimadores son (o se puede hacer que sean) funciones de cualquier 
estadfstico suficiente. En realidad, los estadfsticos suficientes a menudo se pueden usar para 
desarrollar estimadores que tienen varianza minima entre todos los estimadores insesgados. 

Para ilustrar la notion de un estadfstico suficiente, consideremos los resultados de n inten- 
tos de un experimento binomial, X u X 2 ,. . ., X n , donde 

{ 1, si el /-esimo intento es un exito, 

0, si el /-esimo intento es un fracaso. 


Si p es la probabilidad de exito en cualquier intento, entonces, para i = 1,2,..., n. 


X; = 


1 , 

0 , 


con probabilidad p, 
con probabilidad q= 1 - p. 


Suponga que nos dan un valor de Y = Y11=i ^i, el numero de exitos entre los n intentos. Si 
conocemos el valor de Y, ^podemos obtener alguna information adicional acerca de p al ver 
otras funciones de X u X 2 ,..., X n l Una forma de responder esta pregunta es ver la distribucion 
condicional de X u X 2 , . . . , X n dada Y: 


P(X, X n = x„\Y = y) 


P(Xi x n = x„,Y = y) 

P(Y =y) 


El numerador del lado derecho de esta expresion es 0 si YHi -1 x i ^ Y< >' es l a probabilidad de 
una sucesion independiente de numeros 0 y 1 con un total de y numeros 1 y (n — y) numeros 0 
si YTi= t x ‘ = y- m i sma manera, el denominador es la probabilidad binomial de exacta- 
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DEFINICION 9.3 


DEFINICION 9.4 


mente y exitos en n intentos. Por tanto, si y = 0, 1,2, .... n, 


P(Xi = x u ..., X n =x„\Y = y) 


p y(\- P ) n -y 

Qp y (i-p)"- y 



n 

si = y, 

i=i 


0 , 


en cualquier otro punto. 


Es importante observar que la distribucion de X u X 2 , . . . , X n dada Y, no depende de p. 
Esto es, una vez que se conozca Y, ninguna otra funcion de Aj, X 2 ,.... X n proporcionara mas 
informacion sobre el posible valor de p. En este sentido, Y contiene toda la informacion acerca 
de p. Por tanto, se dice que el estadfstico Y es suficiente para p. Generalizamos esta idea en la 
definicion siguiente. 


Sea Fj, Y 2 , . . . , Y n una muestra aleatoria de una distribucion de probabilidad con pa¬ 
rametro desconocido 0. Entonces se dice que el estadfstico U = g(Y v Y 2 , ... , Y n) 
es suficiente para 9 si la distribucion condicional de F,, Y 2 ,..., Y n . dada U, no depende 
de 9. 


En muchas exposiciones anteriores hemos considerado que la funcion de probabilidad p(y), 
asociada con una variable aleatoria discreta [o la funcion de densidad / (y) para una variable 
aleatoria continua], son funciones solo del argumento y. Nuestras futuras exposiciones se sim- 
plifican si adoptamos una notacion que nos permita explfcitamente mostrar el hecho de que la 
distribucion, asociada con una variable aleatoria Y, depende a menudo del valor de un parame- 
tro 9. Si Fes una variable aleatoria discreta que tiene una funcion de masa de probabilidad que 
depende del valor de un parametro 9, en lugar de piy) usamos la notacion p(y \ 9). Del mismo 
modo, indicaremos la dependencia explfcita de la forma de una funcion de densidad continua 
respecto del valor de un parametro 9 si escribimos la funcion de densidad como/(y 1 9) en lugar 
de la/(y) empleada antes. 

La Definicion 9.3 nos dice como comprobar si un estadfstico es suficiente, pero no nos dice 
como hallar un estadfstico suficiente. Recuerde que, en el caso discreto, la distribucion con- 
junta de variables aleatorias discretas fj , Y 2 ...., Y n esta dada por una funcion de probabilidad 
p (yj, y 2 , . . . , y„). Si esta funcion de probabilidad conjunta depende explfcitamente del valor 
de un parametro 9, la escribimos como p (y h y 2 , . . . , y n \ 9). Esta funcion da la probabilidad o 
verosimilitud de observar el evento (Ej = y,, Y 2 = y 2 , . . . , Y n = y n ) cuando el valor del para¬ 
metro es 9. En el caso continuo, cuando la distribucion conjunta de Ej, Y 2 ,..., Y n depende del 
parametro 9, escribiremos la funcion de densidad conjunta como/i v,, y 2 ,.. ., y„ | 9). De aquf 
en adelante, sera conveniente tener un solo nombre para la funcion que defina la distribucion 
conjunta de las variables yj, Y 2 ,. . . , Y n observadas en una muestra. 


Sean y 1; y 2 , ..., y n observaciones muestrales tomadas de variables aleatorias correspon- 
dientes Fj, Y 2 , .... Y n cuya distribucion depende de un parametro 9. Entonces, si Ej, 
Y 2 , ... , Y n son variables aleatorias discretas, la verosimilitud de la muestra, L (y j, 
y 2 , . . . , y n | 9), se define como la probabilidad conjunta de y h y 2 , . . ., y n . 
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Si Y v Y 2 ,.. ., Y n son variables aleatorias continuas, la verosimilitud L (y p v 2 ,..., y n \ 9 ) 
se define como la densidad conjunta evaluada en y v y 2 ,..., y n . 


Si el conjunto de variables aleatorias Y X ,Y 2 , ..., Y n denota una muestra aleatoria de una 
distribucion discreta con funcion de probabilidad p (y \ 0), entonces 


L(yu yi,■■■, y n 10 ) = p(y 1 , yi,---, y n 1 9) 

= p(y x | 0) X p{y 2 | 0) X ■■ -X p(y n | 0), 

mientras que si Y x , Y 2 ,..., Y n tienen una distribucion continua con funcion de dcnsidad /'(y 1 0), 
entonces 

L(y u y 2 ,..., y n \ 0) = f(y u y 2 ,..., y„ \ 0) 

= f(yi\e)Xf(y 2 \ 9) X---X f(y n | 0). 

Para simplificar la notacion, a veces expresaremos la verosimilitud como L(0) en lugar de 

L(y u y 2 , ■ • ■. >’J &)■ 

El siguiente teorema relaciona la propiedad de suficiencia con la verosimilitud L (0). 


TEOREMA 9.4 Sea U un estadfstico basado en la muestra aleatoria Y x , Y 2 , . . . , Y n . Entonces U es un 
estadistico suficiente para la estimacion de un parametro 0 si y solo si la verosimilitud 
L(0) = L (y ,, y 2 ,. . . , y n \ 9) se puede factorizar en dos funciones no negativas, 

L(y u y 2 ,..., y n \ 9) = g(u,9 ) X h(y u y 2 ,y n 

donde g(u, 9) es una funcion solo de u y 9 y h (y,, y 2 ,..., y n ) no es una funcion de 0. 


Aun cuando la demostracion del Teorema 9.4 (tambien conocido como el criterio de fac¬ 
torization) esta fuera del proposito de este libro, ilustramos la utilidad del teorema en el 
siguiente ejemplo. 


EJEMPLO 9.5 


Sea Tj, Y 2 ,. . ., Y n una muestra aleatoria en la que Y l posee la funcion de densidad de probabi¬ 
lidad 


ft \^ 9)e 


-yi/e 


1 o. 


0 < y t < oo, 

en cualquier otro punto, 


donde 9 > 0, i = 1,2Demuestre que Y es un estadistico suficiente para el parametro 9. 


Solucion La verosimilitud L(0) de la muestra es la densidad conjunta 

L{yi,y 2 ,..., y n \9) = /(vi, yi,---, y n \9 ) 

= f(yi\9)Xf(y 2 \9)X---X f(y n | 9) 

g-yi/e e~ n/e e ~y- /s e ~Y,yi /e e -ny/e 

= - X - X ■■•x - = - = - 

0 9 9 9 " 0 " 
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Observe que L{0) es una funcion solo de 6 y y y que si 

e —ny/6 

g(y, 0) = &n y h(y u y 2 ,..., y„) = 1, 


entonces 


L(y u y 2 ,..., y n \0) = g(y,6) Xh(y u y 2 ,..., y„) 

En consecuencia, el Teorema 9.4 implica que Y es un estadfstico suficiente para el parame- 
tro 0. ■ 


El Teorema 9.4 se puede usar para demostrar que hay muchos posibles estadfsticos sufi- 
cientes para cualquier parametro poblacional. Primero que nada, de acuerdo con la Definition 
9.3 o el criterio de factorizacion (Teorema 9.4), la muestra aleatoria por si misma es un es¬ 
tadfstico suficiente. En segundo termino, si Y u Y 2 , , Y n denotan una muestra aleatoria de 

una distribucion con una funcion de densidad con parametro 0 , entonces el conjunto de esta¬ 
dfsticos de orden 7 rl| < Y (1) < ■ ■ ■ < Y (n) , que es una funcion de K |; Y 2 , . . . , Y n , es suficiente 
para 0. En el Ejemplo 9.5 decidimos que Y es un estadfstico suficiente para la estimacion de 6. 
El Teorema 9.4 tambien podrfa haberse usado para demostrar que Yy=i E es otro estadfstico 
suficiente. De hecho, para la distribucion exponencial descrita en el Ejemplo 9.5, cualquier 
estadfstico que sea una funcion biunfvoca de Y es un estadfstico suficiente. 

En nuestro ejemplo inicial de esta seccion, que comprende el numero de exitos en n inten- 
tos, Y = i reduce los datos Aj, X 2 , . . . , X n a un solo valor que permanece suficiente 
para p. En general, nos gustarfa hallar un estadfstico suficiente que reduzca los datos de la 
muestra tanto como sea posible. Aun cuando muchos estadfsticos son suficientes para el pa¬ 
rametro 0 asociado con una distribucion especffica, la aplicacion del criterio de factorizacion 
lleva por lo general a un estadfstico que proporciona el “mcjor” resumen de la informacion 
en los datos. En el Ejemplo 9.5 este estadfstico es Y (o alguna funcion biunfvoca de el). En la 
siguiente seccion, demostraremos la forma en que estos estadfsticos suficientes se pueden usar 
para generar estimadores insesgados con varianza minima. 


Ejercicios 

9.37 Suponga que Xj, X 2 ,. . . , X n denotan n variables aleatorias de Bernoulli independientes e identicamente 
distribuidas, tales que 

P(X, = 1 )=p y P(X, = 0) = 1 - p, 

para cada i = 1,2 , ,n. Demuestre que X, es suficiente para p usando para ello el criterio de 

factorizacion dado en el Teorema 9.4. 

9.38 Sea Y 1 , Y n , . . . , Y n una muestra aleatoria de una distribucion normal con media p. y varianza a 2 . 

a Si p es desconocida y a 2 es conocida, demuestre que Y es suficiente para p. 

b Si p es conocida y a 2 es desconocida, demuestre que £'' ( Y t — p ) 2 es suficiente para a 2 . 

c Si py a 2 son desconocidas ambas, demuestre que Y : y Y^" =l Y 2 son conjuntamente suficientes 

para p y cr 2 . [Asf, se deduce que Y y (7, — Y) 2 o Y y S 2 son tambien conjuntamente suficientes para 
p y cr 2 .] 
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9.39 

9.40 

9.41 

9.42 

9.43 


9.44 


9.45 


9.46 

9.47 

9.48 

*9.49 

*9.50 

*9.51 


Sea Y v Y 2 ,...,Y„ una muestra aleatoria de una distribution de Poisson con parametro A. Demuestre 
mediante condiciones que Y^= i Y, es suficiente para A. 

Sea Ej, Y 2 , . . . , Y n una muestra aleatoria de una distribucion de Rayleigh con parametro 8. (Consulte el 
Ejercicio 9.34.) Demuestre que Yf es suficiente para 8. 

Sea P|, Y -,,..., Y n una muestra aleatoria de una distribucion de Weibull con m conocida y a desconocida. 
(Consulte el Ejercicio 6.26.) Demuestre que Y^=i Y™ es suficiente para a. 

Si Y v Y 2 ,...,Y n denotan una muestra aleatoria de una distribution geometrica con parametro p, de¬ 
muestre que Y es suficiente para p. 

Si Y t ,Y 2 ,, Y„ denotan variables aleatorias independientes y distribuidas de manera identica que per- 
tenecen a una familia de distribucion de potencias con parametros ay 8\ entonces, por el resultado del 
Ejercicio 6.17, si a, 8 > 0, 


f(y\a,8)= 


ay a ~ l /8 a , 0 < y < 8 , 

0, en cualquier otro punto. 

Si 8 es conocida, demuestre que I~[" =1 E,- es suficiente para a. 

Sean Y u Y 2 ,. . ., Y n variables aleatorias independientes y distribuidas identicamente de una distribucion 
de Pareto con parametros ay f3. Entonces, por el resultado del Ejercicio 6.18, si a, /3 > 0, 




a(3 a y ( “ +1) , y > 

0, en cualquier otro punto. 


Si /3 es conocida, demuestre que fj" =| Y, es suficiente para a. 

Suponga que ^i. y 2 ,...,y„ es una muestra aleatoria de una funcion de densidad de probabilidad de la 
familia exponencial (un parametro) de modo que 


f(y\e) 


a(0)6(y)e“ [c(ww] , a < y < b, 

0, en cualquier otro punto. 


donde a y b no dependen de 6. Demuestre que t d{Y,) es suficiente para 0. 


Si E h Y 2 ,..., Y n denotan una muestra aleatoria de una distribucion exponencial con media [3, demuestre 
que/(y | /3) pertenece a la familia exponencial y que Y es suficiente para f3. 

Consulte el Ejercicio 9.43. Si 8 es conocida, demuestre que la familia de distribuciones de potencias per¬ 
tenece a la familia exponencial. ^Cual es un estadfstico suficiente para a? ^Contradice esto su respuesta 
al Ejercicio 9.43? 


Consulte el Ejercicio 9.44. Si /3 es conocida, demuestre que la distribucion de Pareto pertenece a la fa¬ 
milia exponencial. ^Cual es un estadfstico suficiente para al Argumente que no hay contradiction entre 
su respuesta a este ejercicio y la respuesta que encontro en el Ejercicio 9.44. 

Sea Y V Y 2 ,, Y n una muestra aleatoria de una distribucion uniforme en el intervalo (0, 8). Demuestre 
que E (n) = maxtij, Y 2 , . . . , Y n ) es suficiente para 8 . 

Sea E|, Y 2 , . . . , Y n una muestra aleatoria de la distribucion uniforme en el intervalo (8 l , 8 2 ). Demuestre 
que iq) = mfn(Ei, Y 2 ,. .. , E„) y E(„) = max(Ei, Y 2 , ..., Y n ) son conjuntamente suficientes para 
8 1 y d 2 . 

Sea Y } ,Y 2 . ... ,Y n una muestra aleatoria de la funcion de densidad de probabilidad 


/ O’10) 


g-(y-fl), y >e, 

0, en cualquier otro punto. 


Demuestre que y (D = rm'nfyj, Y 2 , . . . , Y n ) es suficiente para 8. 
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*9.52 Sea Y l , Y 2 , . . . , Y n una muestra aleatoria de una poblacion con funcion de densidad 

f(y\e) = 


*9.55 


3y 2 


0 , 


en cualquier otro punto. 


*9.53 


*9.54 


Demuestre que y (,) = maxtYj, Y 2 ,..., Y n ) es suficiente para d. 

Sea y I( F,, . . . , Y n una muestra aleatoria de una poblacion con funcion de densidad 

I 2d 2 

/O’10) = y 3 J 

I 0, en cualquier otro punto. 

Demuestre que y (i> = minlTj, Y 2 , . . ., Y n ) es suficiente para 0. 

Suponga que Y t , Y 2 , . . . , Y n denotan variables aleatorias independientes y distribuidas identicamente de 
una familia de distribution de potencias con parametros ay 0. Entonces, como en el Ejercicio 9.43, si 
a. d > 0, 


f(y\a,d) = 


ay a ~'/e a , O<y<0, 

0, en cualquier otro punto. 

Demuestre que maxlFj, Y 2 , . . . , YJ y ]^" = i Z son conjuntamente suficientes para a yd. 

Suponga que Y v Y 2 , . . ., Y n denotan variables aleatorias independientes y distribuidas identicamente de 
una distribution de Pareto con parametros ay j3. Entonces, como en el Ejercicio 9.44, si a, (3 > 0, 


afl a y- (a+1 \ 

0 , 


y s/s, 

en cualquier otro punto. 


/O l“./3) = 

Demuestre que ]~[" = i Y, y mm (Y l , Y 2 , ... , Y n ) son conjuntamente suficientes para ay j3. 


9.5 Teorema de Rao-Blackwell y estimacion 
insesgada de varianza minima 

Los estadfsticos suficientes desempenan un importante papel para determinar buenos estima¬ 
dores para parametros. Si 9 es un estimador insesgado para 0 y si U es un estadfstico suficiente 
para 6, entonces hay una funcion de U que tambien es un estimador insesgado para 9 y tiene 
una varianza no mayor que 9. Si buscamos estimadores insesgados con varianzas pequenas, 
podemos restringir nuestra busqueda a estimadores que sean funciones de estadfsticos sufi¬ 
cientes. La base teorica para las observaciones anteriores se proporciona en el siguiente resul- 
tado, conocido como el teorema de Rao-Blackwell. 

TEOREMA 9.5 

Demostracion 


El Teorema de Rao-Blackwell Sea 9 un estimador insesgado para 9 tal que V(9)< oo. Si 
U es un estadfstico suficiente para 9, definamos 9* = E(9 | U). Entonces, para toda 9, 

E(9*)=9 y V(9*)<V(9). 

Como U es suficiente para 9 , la distribution condicional de cualquier estadfstico (inclu- 
yendo 9), dada U, no depende de 9. Entonces, 9* = E{9 \ U) no es una funcion de 9 y 
es por tanto un estadfstico. 
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Recuerde los Teoremas 5.14 y 5.15, donde consideramos la forma de hallar medias y 
varianzas de variables aleatorias con el uso de medias y varianzas condicionales. Como 
8 es un estimador insesgado para 8, el Teorema 5.14 implica que 

E(0*) = E[E{8 11/)] = E{8) = 0. 

Entonces, 8* es un estimador insesgado para 8. 

El Teorema 5.15 implica que 

V(8) = V[E{8 | U)] + E[V(8 \ U)] 

= V{8*) + E[V(8\U)]. 

Como V(8 | U = u) > 0 para toda u, se deduce que E[V(8 | t/)] > 0 y por tanto 
que V(0) s V(8*), como dijimos. 


El Teorema 9.5 implica que un estimador insesgado para 8 con una varianza pequena es, 
o puede hacerse que sea, una funcion de un estadlstico suficiente. Si tenemos un estimador 
insesgado para 8, podrfamos mejorarlo con el uso del resultado del Teorema 9.5. Inicialmente 
puede parecer que si se aplica una vez el teorema de Rao-Blackwell para obtener un mejor 
estimador insesgado y luego se aplica nuevamente al nuevo estimador resultante se obtiene 
un estimador insesgado aun mejor. Si aplicamos el teorema de Rao-Blackwell usando el esta¬ 
dlstico suficiente U, entonces 0* = E(8 \ U) sera una funcion del estadlstico U, por ejemplo 
0* = h(U). Suponga que reaplicamos el teorema de Rao-Blackwell a 8* con el uso del mismo 
estadlstico suficiente U. Puesto que, en general, E(Ji(U)\U) = h(U), vemos que usando de 
nuevo el teorema de Rao-Blackwell nuestro “nuevo” estimador es simplemente h(U) = 8*. 
Esto es, si usamos el mismo estadlstico suficiente en aplicaciones sucesivas del teorema de 
Rao-Blackwell, no ganamos nada despues de la primera aplicacion. La unica forma en que 
aplicaciones sucesivas pueden llevar a mejores estimadores insesgados es si usamos un es¬ 
tadlstico suficiente distinto cada vez que se reaplica el teorema. Asl, no es necesario usar 
el teorema de Rao-Blackwell sucesivamente si usamos el estadlstico suficiente correcto en 
nuestra aplicacion inicial. 

Debido a que numerosos estadlsticos son suficientes para un parametro 8 asociado con una 
distribution, ;,que estadlstico suficiente debemos usar cuando apliquemos este teorema? Para 
las distribuciones que estudiamos en este texto, el criterio de factorizacion de manera tlpica 
identifica un estadlstico U que mejor resume la information de los datos acerca del parametro 
8. Tales estadlsticos reciben el nombre de estadlsticos suficientes minimos. El Ejercicio 9.66 
presenta un metodo para determinar un estadlstico suficiente mlnimo que podrla ser de in- 
teres para algunos lectores. En unos pocos de los ejercicios subsiguientes veremos que este 
metodo por lo general da los mismos estadlsticos suficientes que los obtenidos con el criterio 
de factorizacion. En los casos que consideramos, estos estadlsticos poseen otra propiedad 
(completabilidad) que garantiza que, si aplicamos el Teorema 9.5 usando U, no solo obte- 
nemos un estimador con una varianza mas pequena sino que tambien obtenemos en realidad 
un estimador insesgado para 8 con varianza minima. Este estimador recibe el nombre de 
estimador insesgado de varianza minima (MVUE, por sus siglas en ingles). Puede consultar 
mas detalles en la obra de Casella y Berger (2002), Hogg, Craig y McKean (2005), o Mood, 
Graybill y Boes (1974). 

Por tanto, si empezamos con un estimador insesgado para un parametro 8 y el estadlstico 
suficiente obtenido por medio del criterio de factorizacion, la aplicacion del teorema de Rao- 
Blackwell en general lleva a un MVUE para el parametro. El calculo directo de los valores 
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esperados condicionales puede ser diffcil. No obstante, si U es el estadfstico suficiente que 
mejor resume los datos y alguna funcion de U, por ejemplo h{U), se puede hallar de modo 
que E [h {U)\ = 9, se deduce que h(U) es el MVUE para 9. Ilustramos este metodo con varios 
ejemplos. 


EJEMPLO 9.6 Sea Y U Y 2 ,..., Y n una muestra aleatoria de una distribution donde P (Y j = 1) = p y P ( Y i = 0) 
= 1 —p, con p desconocida (es frecuente que tales variables aleatorias se denominen variables 
de Bernoulli). Use el criterio de factorizacion para hallar un estadfstico suficiente que mejor 
resuma los datos. Proporcione un MVUE para p. 

Solucion Observe que la funcion de probabilidad anterior se puede escribir como 

P(Y i =y i )=p*(l-p) 1 -*, y.' =0,1. 

Por tanto, la verosimilitud L (p) es 


L(y i, yi,..., y„ I p) = piy t, yi,---, y„\p) 

= p y '( 1 - p) X ~ y ' X p y \ 1 - p) l ~ y2 X ■••x p y "{ 1 - p) x ~ y " 

= pT.yt(\ - py-Hn' x . 

s(Z y,,p) 

De acuerdo con el criterio de factorizacion, jj = ^" = K ( es suficiente para p. Este estadfstico 
resume mejor la information acerca del parametro p. Observe que E (U) = np, o bien, de la mis- 
ma manera, E (Ujn) = p. Asf U/ n = Y es un estimador insesgado para p. Como este estimador 
es una funcion del estadfstico suficiente { Y ,, el estimador p = K es el MVUE para p. ■ 


EJEMPLO 9.7 


Suponga que lj, Y 2 , , Y n denotan una muestra aleatoria de la funcion de densidad de 

Weibull, dada por 


f(y\0) 



y > 0, 


0, en cualquier otro punto. 


Encuentre un MVUE para 6. 


Solucion Comencemos utilizando el criterio de factorizacion para hallar el estadfstico suficiente que 
mejor resume la information acerca de 6. 


L(yi, y 2 ,..., y„ \ 9) = /(yi,y 2 ,..., y„ \9) 


n 

(yi X y 2 X---X y„) exp 




X (yi X y 2 X • ■ ■ X y„). 

v_^_ J 




h(y i,y 2 ,-,y n ) 
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Por tanto, U = Xa-i Y? es el estadfstico suficiente mi'nimo para 9. 

Ahora debemos determinar una funcion de este estadfstico que sea insesgada para 9. Si 
hacemos W = Y 2 , tenemos 



Esto es, Yf tiene una distribucion exponencial con parametro 9. Como 


se deduce que 


E(Yf) = E(W) =9 y 



= n9. 



es un estimador insesgado de 9 que es una funcion del estadfstico suficiente Xa=i . Por 
tanto, 9 es un MVUE del parametro 9 de Weibull. ■ 


El siguiente ejemplo ilustra la aplicacion de esta tecnica para estimar dos parametros des- 
conocidos. 


EJ EMPLO 9.8 Suponga que Y v Y 2 , , Y n denotan una muestra aleatoria de una distribucion normal con 

media desconocida fi y varianza cr 2 . Encuentre los MVUE para j± y cr 2 . 

Solution De nuevo, al aplicar la funcion de verosimilitud, tenemos 
L(y u y 2 ,..., y„ I /x,cr 2 ) 

= j„I/a,o- 2 ) 


l 


ay/2rr 

1 

( t\/2tt 
1 


1 


cr 


V27 t 


exp 


exp 


exp 


2^ 


1=1 


1 / n ' l 
-^{±y?- 2 »±y‘ 


2(7 2 

—tl/JL 1 

2(7 2 


+ njjL~ 


11=1 


exp 


/=! 


(Erf- ^Y.y> 


Por tanto, Y^=\ ^ y 5Z;=i constituyen conjuntamente estadfsticos suficientes para /i y 
cr 2 . 

Sabemos, de calculos anteriores, que Y es insesgado para j± y que 


S 2 = 


1 


7 E( K ' - n 2 = — 

1 n — 

i =l 


Y.Y-'Y- 


i =1 


es insesgado para cr 2 . Debido a que estos estimadores son funciones de los estadfsticos que 
mejor resumen la information acerca de /a y cr 2 , son los MVUE para /i y cr 2 . ■ 
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El criterio de factorization tambien se puede utilizar, junto con el teorema de Rao- 
Blackwell, para hallar los MVUE para funciones de los parametros asociados con una distri¬ 
bution. Ilustramos la tecnica en el siguiente ejemplo. 


EJ EM P LO 9.9 Sea Y { , Y 2 ,, Y n una muestra aleatoria de la funcion de densidad exponential dada por 


f(y\0) 



0, en cualquier otro punto. 


Encuentre un MVUE de V (Y). 

Solution En el Capftulo 4 determinamos que E (Y t ) = 6 y que V (V,) = 0 2 . El criterio de factorization 
implica que JC=i ^ es el mejor estadfstico suficiente para 0. De hecho, Y es el MVUE de 6. 
Por tanto, podrfamos usar Y como estimador de 0 2 . Pero 

e (r) = v(y) + [E{Y)f = 6 — + e 1 = ) 0 2 - 

_2 

Se deduce que Y es una estimacion sesgada para 6 2 . No obstante, 

——) Y 2 
n + 1 / 

es un MVUE de 0 2 porque es un estimador insesgado para 6 2 y una funcion del estadfstico 
suficiente. Ningun otro estimador insesgado de 6 2 tendra una varianza mas pequena que este. 


Con frecuencia un estadfstico suficiente de un parametro 0 se puede usar para construir un 
intervalo de confianza exacto para 9 si es que se puede hallar la distribution de probabilidad 
del estadfstico. Generalmente los intervalos resultantes son los mas cortos que se pueden 
hallar con un coeficiente de confianza especificado. Ilustramos la tecnica con un ejemplo que 
comprende la distribution de Weibull. 


EJEMPLO 9.10 El siguiente conjunto de datos, con mediciones en cientos de horas, representa la vida util de 
diez componentes electronicos identicos que operan en un sistema de control de gufa para 
proyectiles: 

.637 1.531 .733 2.256 2.364 
1.601 .152 1.826 1.868 1.126 


Se supone que la vida util de un componente de este tipo sigue una distribution de Weibull con 
una funcion de densidad dada por 


f(y\o) 



o. 


y > 0 , 

en cualquier otro punto. 


Utilice los datos para construir un intervalo de confianza de 95% para 6. 
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Solucion En el Ejemplo 9.7 vimos que el estadfstico suficiente que resume mejor la informacion acerca 
de 6 es Xa=i . Usaremos este estadfstico para format - una cantidad pivote para construir el 
intervalo de confianza que buscamos. 

Recuerde del Ejemplo 9.7 que W-, = Yf tiene una distribucion exponencial con media 6. 
Ahora considere la transformacion 7j = 2WJ9. Entonces 


frit) 


(et\d(0t/ 2 ) 

fw \2 )—dT~ 


(>) £W (*) 



t >0. 


Asf, para cada i = 1, 2,7j tiene una distribucion x~ con 2 grados de libertad. Ademas, 
como las variables Y i son independientes, las variables 7’ son independientes para i = 1, 
2, . . . , n. La suma de variables aleatorias \ 2 independientes tiene una distribucion x" con 
grados de libertad iguales a la suma de los grados de libertad de las variables en la suma. Por 
tanto, la cantidad 


to 




10 





tiene una distribucion x 2 con 20 grados de libertad. Asf que. 



es una cantidad pivote y podemos usar el metodo del pivote (Seccion 8.5) para construir el 
intervalo de confianza buscado. 

De la Tabla 6, Apendice 3, podemos encontrar dos numeros ay b tales que 


P 


10 




;=i 


= .95. 


1 


Si despejamos 9 y la colocamos en la parte media, tenemos 

/ o 10 

0 

'2 


■ 95 = ' > HiE 1 7H- /> M 


e 


i 


i=i 

,10 v2 


= P 


<0 < 


b 2r",f 2 a 

\ /- 4l — 1 l / 

2I!!i^\ 


De la Tabla 6, Apendice 3, el valor que limita un area de .025 en la cola inferior de la distribu¬ 
cion x 2 con 20 grados de libertad es a = 9.591. El valor que limita un area de .025 en la cola 
superior de la misma distribucion es b = 34.170. Para los datos anteriores, 5Z/-i = 24.643. 

Por tanto, el intervalo de confianza de 95% para el parametro 9 de Weibull es 


/2(24.643) 2(24.643) \ 
V 34.170 ’ 9.591 )’ 


o (1.442,5.139). 


Este es un intervalo bastante amplio para 0, pero esta basado solo en diez observaciones. ■ 


En esta seccion hemos visto que el teorema de Rao-Blackwell implica que los estimadores 
insesgados con pequenas varianzas son funciones de estadfsticos suficientes. En general, el 
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criterio de factorizacion presentado en la Seccion 9.4 se puede aplicar para encontrar estadfs- 
ticos suficientes que resuman mejor la information contenida en datos muestrales relacionada 
con los parametros de interes. Para las distribuciones que consideramos en este texto, un 
MVUE para un parametro 6 objetivo se puede hallar de la siguiente manera. Primero, deter- 
minamos el mejor estadfstico suficiente, U, en seguida hallamos una funcion de U, h(U), tal 
que E[h(U)] = 6. 

Regularmente este metodo funciona bien, pero en ocasiones el mejor estadfstico suficiente 
es una funcion muy complicada de las variables aleatorias observables en la muestra. En casos 
como este puede ser diffcil hallar una funcion del estadfstico suficiente que sea un estimador 
insesgado para el parametro objetivo. Por esta razon, dos metodos adicionales para determinar 
estimadores —el metodo de momentos y el metodo de maxima verosimilitud— se presentan 
en las dos secciones siguientes. Un tercer metodo de estimacion importante, el metodo de 
mfnimos cuadrados, es el tema del Capftulo 11. 


Ejercicios 

9.56 Consulte el Ejercicio 9.38(b). Encuentre un MVUE de a 1 . 

9.57 Consulte el Ejercicio 9.18. ^E1 estimador de cr dado ahf es un MVUE de <x 2 ? 

9.58 Consulte el Ejercicio 9.40. Use £j"=i Y 2 P ara h a H ar un MVUE de 8. 

9.59 El numero de descomposturas F por dra para cierta maquina es una variable aleatoria de Poisson con 
media A. El costo diario de reparation de estas descomposturas esta dado por C = 3Y 2 . Si U, Y 2 ,.. . , Y n 
denota el numero observado de descomposturas para n dfas seleccionados de manera independiente, 
encuentre un MVUE para E(C). 

9.60 Sea F,, Y 2 , . . . , Y n una muestra aleatoria de la funcion de densidad de probabilidad 

, ( 8y e ~\ 0 <y < 1, 0 > 0, 

f(y\0)= n , . 

1 0, en cualquier otro punto. 

a Demuestre que esta funcion de densidad pertenece a la familia exponencial (de un parametro) y que 
Y/"=i ~ ln(7i) es suficiente para 8. (Vease Ejercicio 9.45.) 
b Si W t ~ — ln(lj), demuestre que Wj dene una distribucion exponencial con media 1/8. 
c Utilice metodos similares a los del Ejemplo 9.10 para demostrar que 28 £j" =l VP,- tiene una distribu¬ 
cion x 2 con 2 n grados de libertad. 
d Demuestre que 

E ( _I_U 1 

\2d E"=i VP,- / 2{n — 1)' 


9.61 

9.62 

9.63 


[Sugerencia: recuerde el Ejercicio 4.112.] 
e ^Cual es el MVUE para 83 

Consulte el Ejercicio 9.49. Use (Y n ) para hallar un MVUE de 8. (Vease el Ejemplo 9.1.) 
Consulte el Ejercicio 9.51. Encuentre una funcion de Y a) que sea un MVUE para 8. 

Sea Fj, . . . , F n una muestra aleatoria de una poblacion con funcion de densidad 


fiy |0) = 


V 
8 3 ’ 
0 , 


0 < y < 8, 

en cualquier otro punto. 





Ejercicios 471 


En el Ejercicio 9.52 se demostro que = max(Tj, Y 2 , , Y n ) es suficiente para 0. 

a Demuestre que F < n > tiene funcion de densidad de probabilidad 

| 3ny 3n ~ 1 

f(ri)<J \0) = Qin 

\ o, 

b Encuentre el MVUE de 6. 

9.64 Sea Y l , Y 2 , ... , Y n una muestra aleatoria de una distribucion normal con media p. y varianza 1. 
a Demuestre que el MVUE de p? es p 2 = Y 2 — l/n. 
b Obtenga la varianza de p 2 . 

*9.65 En este ejercicio ilustramos la aplicacion directa del teorema de Rao-Blackwell. Sean Y v Y 2 , , . . ,Y n 
variables aleatorias independientes de Bernoulli con 


0 <y <0, 

en cualquier otro punto. 


p(yi\p) = p*Q-p) 1 ~ x , y, =o,i. 


Esto es , P (Yj = 1) = p y P (Y t = 0) = 1 -p. Encuentre el MVUE de p (1 - p), que es un termino de la 
varianza de Y f o W = Yl"= i ^, mediante los siguientes pasos. 

a Sea 


1, si U, = 1 y Y 2 =0, 

0, en cualquier otro punto. 


Demuestre que E (T)= p (1 — p). 
b Demuestre que 


c Demuestre que 


P(T = 1 | W =w) = 


w(n — w ) 
n(n — 1) 


E(T\W) 



n — — 

--E(l — Y) 

n — 1 


y por tanto que nY{ 1 — E)/( n — 1) es el MVUE de p (1 —p). 

*9.66 La funcion de verosimilitud L (y x , y 2 ,.. ., y n \ 6) toma valores diferentes dependiendo de los argumentos 
(y lt y 2 , . . . , v„). Un metodo para deducir un estadistico suficiente mmimo desarrollado por Lehmann 
y Scheffe usa la relacion entre las verosimilitudes evaluadas en dos puntos (x u x 2 , . . . , x n ) y (y u 
72 . ■ • ■ . Yn)- 

L(x i, x 2 ,..., x n 1 0) 

L(yu yz,..-, y n |0) 


Muchas veces es posible hallar una funcion g (x,, . . . , x„) tal que esta relacion no tenga parametros 

9 desconocidos si y solo si g(x i, x 2 ,.. •, x n ) = g(y i, y 2 ,..., y„). Si se puede hallar esa funcion g, 
entonces g (yj, Y 2 , . . ., Y n ) es un estadistico suficiente minimo para 8. 

a Sea Tj, Y 2 , . . . , Y n una muestra aleatoria de una distribucion de Bernoulli (vea el Ejemplo 9.6 y el 
Ejercicio 9.65) conp desconocida. 

i Demuestre que 

L(x i, x 2 ,..., x n | p) = / p 

L(y i. 72, ■ • •, y K I p) V 1 ~ p) 
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ii Demuestre que para que esta relation sea independiente de p, debemos tener 

n n n n 

~ &• = 0 ° = &■ 


i=i i=i 


i=l i =1 


iii De acuerdo con el metodo de Lehmann y Scheffe, ^cual es el estadfstico suficiente mi'nimo para pi 
^Como se compara este estadfstico suficiente con el estadfstico suficiente deducido en el Ejemplo 
9.6 usando el criterio de factorization? 


b Considere la densidad de Weibull estudiada en el Ejemplo 9.7. 
i Demuestre que 


L (jci, jc 2 > • • • ’ x n | 9) 
L(y i, y 2 ,. y„ I 9) 


{ *ix 2 ■■■x n 

\yi yi ■■■yn 


) 


exp 





ii Demuestre que Y? es un estadfstico suficiente mfnimo para 9. 

*9.67 Consulte el Ejercicio 9.66. Suponga que se toma una muestra de tamano n de una poblacion normal 
con media p y varianza a 2 . Demuestre que Y11= i U, y Xa= t conjuntamente forman estadfsticos 

suficientes mfnimos para p y a 2 . 

*9.68 Suponga que un estadfstico U tiene una funcion de densidad de probabilidad que es positiva en el inter- 
valo a^u^b y suponga que la densidad depende de un parametro 9 que puede variar en el intervalo aq 
< 9 £ a 2 . Suponga tambien que g(u) es continua para u en el intervalo [a, b\. Si E [(g(l/) 1 9} = 0 para 
toda 9 en el intervalo [aq, a 2 ] implica que g(u) sea identicamente cero, entonces se dice que la familia 
de funciones de densidad {fu(u \ 9), aq £ 9 £ a-,} esta completa. (Todos los estadfsticos que empleamos 
en la Section 9.5 tienen familias completas de funciones de densidad.) Suponga que U es un estadfstico 
suficiente para 9, y g\(U) y g 2 (U) son estimadores insesgados de 9. Demuestre que, si la familia de fun¬ 
ciones de densidad para U esta completa, g^U) debe ser igual a g 2 (U), y entonces hay una funcion unica 
de U que es un estimador insesgado de 9. 

Acoplada con el teorema de Rao-Blackwell, la propiedad de completabilidad de/j, (u \ 9), junto con la 
suficiencia de U, asegura que hay un estimador insesgado unico de varianza minima (UMVUE) de 9. 


9.6 Metodo de momentos 

En esta section estudiaremos uno de los metodos mas antiguos para obtener estimadores 
puntuales: el metodo de momentos. Un metodo mas refinado, el de verosimilitud maxima, es 
el tema de la Section 9.7. 

El metodo de momentos es un procedimiento muy sencillo para hallar un estimador para 
uno o mas parametros poblacionales. Recuerde que el Uesimo momento de una variable alea- 
toria, tornado alrededor del origen, es 


/4 = E(Y k ). 


El correspondiente A'-esimo momento muestral es el promedio 



El metodo de momentos esta basado en la idea de que los momentos muestrales deben dar 
buenas estimaciones de los momentos poblacionales correspondientes. 
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Es decir, m' k debe ser un buen estimador de fJi' k , para k = 1,2,... Entonces, debido a que los 
momentos poblacionales /jl\ , /i' 2 ,..., fi ' k son funciones de los parametros poblacionales, po- 
demos igualar los correspondientes momentos poblacionales y muestrales y despejar los esti- 
madores deseados. En consecuencia, el metodo de momentos se puede expresar como sigue. 


Metodo de momentos 

Escoja como estimaciones los valores de los parametros que son soluciones de las ecua- 
ciones fi' k = m ' k , para k= 1,2 ,,t, donde t es el numero de parametros por estimar. 


EJEMPLO 9.11 Una muestra aleatoria de n observaciones, Pj, Y 2 , , Y n se selecciona de una poblacion 

en la que Y t , para i = 1,2,...,«, posee una funcion de densidad de probabilidad uniforme en 
el intervalo (0, 0) donde 9 es desconocida. Use el metodo de momentos para estimar el para- 
metro 6. 


Solucion El valor de /jl\ para una variable aleatoria uniforme es 

, 0 
/U=M = 2- 

El correspondiente primer momento muestral es 

m'i = -X> =Y- 

n ‘ ^ 


Igualando la poblacion correspondiente y el momento muestral, obtenemos 

, e - 

»\ = - 2 = y. 


El estimador que se obtiene mediante el metodo de momentos para 0 es la solucion de la ecua- 
cion anterior. Esto es, 9 = 2Y. ■ 


Para las distribuciones que consideramos en este texto, los metodos de la Seccion 9.3 se 
pueden utilizar para demostrar que los momentos muestrales son estimadores consistentes de 
los momentos poblacionales correspondientes. Debido a que los estimadores obtenidos con 
el metodo de momentos obviamente son funciones de los momentos muestrales, suelen ser 
estimadores consistentes de sus respectivos parametros. 


EJEMPLO 9.12 Demuestre que el estimador 9 =2 Y, encontrado en el Ejemplo 9.11, es un estimador consis- 
tente para 9. 

Solucion En el Ejemplo 9.1, demostramos que 9 = 2Y es un estimador insesgado para 9 y que 
V(9) = 9 1 ! 3/). Como Ifm V(9) = 0, elTeorema9.1 implica que 9 = 2Y esun estima¬ 
dor consistente para 9. ■ 
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Aun cuando el estimador 0 obtenido en el Ejemplo 9.11 es consistente, no es necesaria- 
mente el mejor estimador para 0. De hecho, el criterio de factorizacion da = max(Fj, Y 2 , 
. . . , Y n ) como el mejor estadfstico suficiente para 0. Entonces, de acuerdo con el teorema de 
Rao-Blackwell, el estimador que se obtenga mediante el metodo de momentos tendra varian- 
za mas grande que un estimador insesgado basado en De hecho, se demostro que este es 
el caso en el Ejemplo 9.1. 


EJEMPLO 9.13 Una muestra aleatoria de n observaciones lj, Y 2 , , Y n , se selecciona de una poblacion en 

la que Y t , para i = 1,2posee una funcion de densidad de probabilidad gamma con 
parametros a y (i (vease la Seccion 4.6 para la funcion de densidad de probabilidad gamma). 
Encuentre los estimadores por el metodo de momentos para los parametros desconocidos 
ay /3. 

Solucion Debido a que buscamos estimadores para dos parametros a y /3, debemos igualar dos pares de 
momentos poblacionales y muestrales. 

Los primeros dos momentos de la distribucion gamma con parametros a y [3 son (si es 
necesario, vea al final de este libro) 

yuj = /r = a/3 y fjb ' 2 = ct 2 + /jl 2 = aft 2 + a 2 /3 2 . 

Ahora iguale estas cantidades con sus correspondientes momentos muestrales y despeje 
ay ft. Asr, 

/uj = a/3 = m\ = Y , 

/4 = «/3 2 + a 2 /3 2 = m' 2 = - ^ Y 2 . 

n U 

De la primera ecuacion, obtenemos fi = Y/ a. Sustituyendo en la segunda ecuacion y despe- 
jando a , obtenemos 

Y 2 _ nY 2 

( J2Y 2 /n)-Y 2 ~ T.U W -Y) 2 ' 

Sustituyendo a en la primera ecuacion, obtenemos 

k_Y _ ZU(Y L -W u 

P a nY 


Los estimadores del metodo de momentos a y j3 del Ejemplo 9.13 son consistentes. 
Y converge en probabilidad en LYlj) = a(3 y (1 / n) Y^=\ Y 2 converge en probabilidad en 
E(Y 2 ) = a/3 2 + a 2 j3 2 . Por lo tanto, 


a = 



es un estimador consistente de 


(af3) 2 

a(3 2 + a 2 /3 2 — ( af3 ) 2 


y 


b 


Y . . a/3 

— es un estimador consistente de —— = R. 
a 


a 
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Usando el criterio de factorizacion podemos demostrar que ^" =1 Y, y el producto ]”[" =1 Y,] son 
estadfsticos suficientes para la funcion de densidad gamma. Como los estimadores del metodo 
de momentos a y /3 no son funciones de estos estadfsticos suficientes, podemos hallar mas 
estimadores eficientes para los parametros a v (i. No obstante, es considerablemente mas di- 
ffcil aplicar otros metodos para hallar estimadores de estos parametros. 

Para resumir, el metodo de momentos permite generar estimadores de parametros desco- 
nocidos al igualar los correspondientes momentos muestrales y poblacionales. El metodo es 
facil de emplear y proporciona estimadores consistentes, pero los estimadores obtenidos por 
este metodo en ocasiones no son funciones de estadfsticos suficientes. En consecuencia, es 
frecuente que los estimadores del metodo de momentos no sean eficientes y en muchos casos 
sean sesgados. Las virtudes basicas de este metodo son su facilidad de aplicacion y que a 
veces proporciona estimadores con propiedades razonables. 


Ejercicios 


9.69 Sea Y v Y 2 . Y„ una muestra aleatoria de la funcion de densidad de probabilidad 

(9 + 1)/, 0 < y < 1 9 > -1, 


f(y I 0) = 


0 , 


en cualquier otro punto. 


Encuentre un estimador para 9 por el metodo de momentos. Demuestre que el estimador es consistente. 
^E1 estimador es una funcion del estadfstico suficiente — Y^=i ln(F,) que podemos obtener del criterio 
de factorizacion? ^Que implicaciones dene esto? 

9.70 Suponga que Y u Y 2 ,..., Y n constituyen una muestra aleatoria de una distribucion de Poisson con media 
A. Encuentre el estimador del metodo de momentos para A. 

9.71 Si 7|, Y 2 , . . . , Y n denotan una muestra aleatoria de la distribucion normal con media conocida /r = Oy 
varianza desconocida cr 2 , encuentre el estimador de <x 2 por el metodo de momentos. 

9.72 Si F t , Y 2 , . . . , Y n denotan una muestra aleatoria de una distribucion normal con media /r y varianza cr 2 , 
encuentre los estimadores de /jl y a 2 por medio del metodo de momentos. 

9.73 Una uma contiene 9 bolas negras y N- 9 bolas blancas. Una muestra de n bolas se ha de seleccionar sin 
restitucion. Sea Y el numero de bolas negras de la muestra. Demuestre que (N/n)Y es el estimador del 
metodo de momentos para 9. 

9.74 Sea Y l , Y 2 , . . . , Y n una muestra aleatoria de la funcion de densidad de probabilidad dada por 


f(y\0) 


(^)(0-y), O<y<0, 

0, en cualquier otro punto. 


a Encuentre un estimador para 9 usando el metodo de momentos. 
b ^Este estimador es un estadfstico suficiente para 91 

9.75 Sea Y v Y 2 , . . . , Y n una muestra aleatoria de la funcion de densidad de probabilidad dada por 


/(y 1 0) 


T(29) 

[TO? 

0 , 


(/■‘)(i ~y) e ~\ 


0 <y < 1, 

en cualquier otro punto. 


Encuentre el estimador de 9 por el metodo de momentos. 
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9.76 Sean Aj, X 2 , . . . ,X lt variables aleatorias de Bernoulli independientes tales que P (X t =1) = p y P {X t = 
0) = 1 — p para cada i = 1, 2, 3,... Con la variable aleatoria Y denote el numero de intentos necesario 
para obtener el primer exito, es decir, el valor de i para el cual = 1 ocurre primero. Entonces Y tiene 
una distribucion geometrica con P (Y = y) = (1 - p) y ~ ] p, para _y = 1, 2, 3,... Encuentre el estimador del 
metodo de momentos para p basado en esta tinica observation de Y. 


9.77 Sean F x , Y 2 , . . . , Y n variables aleatorias uniformes independientes y distribuidas identicamente en el 
intervalo (0, 39). Deduzca el estimador del metodo de momentos para 6. 


9.78 Sean Y v Y 2 , . . . , Y n variables aleatorias independientes y distribuidas identicamente de una familia de 
distribucion de potencias con parametros a y 9 = 3. Entonces, corno en el Ejercicio 9.43, si a > 0, 


/O' l“) 


ay a ~ x i 3“, 0<y<3, 

0, en cualquier otro punto.. 


*9.79 


Demuestre que E (Fj) = 3 a/(a + 1) y deduzca el estimador del metodo de momentos para a. 

Sean Y v Y 2 ,, Y n variables aleatorias independientes y distribuidas identicamente de una distribucion 
de Pareto con parametros ay [3, donde [3 es conocida. Entonces, si a > 0, 


f(y\a,(3) 


a/3“y-<“ +1 >, y>/3, 

0, en cualquier otro punto. 


Demuestre que E (F ; ) = af3/{a - 1) si a > 1 y E (FJ) no esta definida si 0 < a < 1. Entonces, el estima¬ 
dor del metodo de momentos para a no esta definido. 


9.7 Metodo de maxima verosimilitud 

En la Section 9.5 presentamos un metodo para obtener un estimador insesgado de varianza 
minima (MVUE) por un parametro objetivo: usando el criterio de factorization junto con 
el teorema de Rao-Blackwell. El metodo requiere que encontremos alguna funcion de un 
estadistico suficiente minirno que es un estimador insesgado para el parametro objetivo. Aun 
cuando tenemos un metodo para hallar un estadistico suficiente, la determination de la fun¬ 
cion del estadistico suficiente minimo que proporciona un estimador insesgado puede ser en 
gran medida una cuestion de azar. La Section 9.6 contiene una exposicion del metodo de 
momentos. El metodo de momentos es intuitivo y facil de aplicar, pero por lo general no lleva 
a los mejores estimadores. En esta section presentamos el metodo de maxima verosimilitud 
que con frecuencia proporciona estimadores insesgados de varianza minima (MVUE). 

Usamos un ejemplo para ilustrar la logica en la que esta basado el metodo de maxima ve¬ 
rosimilitud. Suponga que tenemos una caja que contiene tres pelotas. Sabemos que cada una 
de las pelotas puede ser roja o blanca, pero no sabemos el numero total de cualquiera de los 
colores. No obstante, podemos muestrear aleatoriamente dos de las pelotas sin restitution. Si 
nuestra muestra aleatoria contiene dos pelotas rojas, / cual seria una buena estimacion del nu¬ 
mero total de pelotas rojas en la caja? Obviamente, el numero de pelotas rojas en la caja debe 
ser dos o tres (si hubiera cero o una pelota roja en la caja, seria imposible obtener dos pelotas 
rojas cuando se hace muestreo sin restitution). Si hay dos pelotas rojas y una pelota blanca en 
la caja, la probabilidad de seleccionar aleatoriamente dos pelotas rojas es 
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EJEMPLO 9.14 


Solucion 


Por otra parte, si hay tres pelotas rojas en la caja, la probabilidad de seleccionar aleatoriamente 
dos pelotas rojas es 



Parece razonable escoger el tres como la estimacion del numero de pelotas rojas en la caja 
porque esta estimacion maximiza la probabilidad de obtener la muestra observada. Desde 
luego que es posible que la caja contenga solo dos pelotas rojas, pero el resultado observado 
confrere mas credito a que haya tres pelotas rojas en la caja. 

Este ejemplo ilustra un metodo para hallar un estimador que puede aplicarse a cualquier 
situacion. La tecnica, llamada metodo de maxima verosimilitud, selecciona como estimacio- 
nes los valores de los parametros que maximizan la verosimilitud (la funcion de probabi¬ 
lidad conjunta o funcion de densidad conjunta) de la muestra observada (vea la Definition 
9.4). Recuerde que nos referimos a este metodo de estimacion en el Capftulo 3 donde, en 
los Ejemplos 3.10 y 3.13 y en el Ejercicio 3.101, encontramos las estimaciones de maxima 
verosimilitud del parametro p con base en observaciones individuales en variables aleatorias 
binomiales negativas, binomiales y geometricas, respectivamente. 


Metodo de maxima verosimilitud 

Suponga que la funcion de verosimilitud depende de k parametros 9 V 0 2 , ■ ■ ■, 0 k . Escoja 
como estimaciones los valores de los parametros que maximicen la verosimilitud 
L (yi, y 2 ,---, }’n 0 u 0 2 ,...,0k)- 


Para destacar el hecho de que la funcion de verosimilitud es una funcion de los parametros 
9 V 9 1 , . . . , 0 k , a veces expresamos la funcion de verosimilitud como L{9 V 0 2 , ... , 9 k ). Es 
comun referirnos a estimadores de maxima verosimilitud como a los MLE, por sus siglas en 
ingles. Ilustramos el metodo con un ejemplo. 


Un experimento binomial consistente en n ensayos resulto en las observaciones y v y 2 ,.. ., y n , 
donde y ; = 1 si el /-esimo intento fue un exito y y ; = 0 en cualquier otro punto. Encuentre el 
MLE de p, la probabilidad de un exito. 

La verosimilitud de la muestra observada es la probabilidad de observar y lt y 2 , ... , y n . En 
consecuencia, 

n 

L(p) = L(y u y 2 ,..., y„ \ p) = p y (l - p) n ~ y , donde y = ^y ; . 

i = 1 

Ahora deseamos determinar el valor de p que maximice L (p). Si y = 0, L (p) = (1 — p) n y 
L (p) se maximiza cuando p = 0. Analogamente, si y = n, L ( p) = p" y L( p) se maximiza 
cuando p = 1. Siy = 1, 2,... ,n—\, entonces L(p)= p’ (1 -p) * l ~ y es cero cuando p = 0 y p = 

1 y es continuapara valores de p entre 0 y 1. Entonces, paray = 1, 2,.... n- I. podemos deter¬ 
minar el valor de p que maximice L (p) al igualar a cero la derivada dL{p)/dp y despejando p. 

Usted notara que \n[L(p)] es una funcion creciente en forma monotonica de Lip). En con¬ 
secuencia, tanto ln[L(/?)] como Lip) se maximizan para el mismo valor de p. Como Lip) es un 
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producto de funciones de p y hallar la derivada de productos resulta laborioso, es mas facil 
hallar el valor de p que maximice ln[L(p)]. Tenemos 

In [L{p)] = In [/?>'( 1 - pf-y] = y In p + (n - y ) ln(l - p). 


Si y = 1, 2,.... n — 1, la derivada de ln[L(p)] con respecto a p, es 


d\n[L(p)] 

dp 


= y[^)+(n-y) 


-1 


1 ~P 


Para y = 1, 2,. . . , n — 1, el valor de p que maximice (o minimice) ln[L(p)] es la solucion de 
la ecuacion 

y_ _ n ~y 
P 1 ~P 


= 0 . 


Resolviendo, obtenemos la estimacion p = y /n. Se puede verificar facilmente que esta solu¬ 
cion se presenta cuando ln[L(p)] [y por tanto Lip)] alcanza un maximo. 

Debido a que L ip) se maximiza en p = 0 cuando y = 0, en p = 1 cuando y = n y en p = 
y/n cuando y = 1 , 2, ..., n — 1 , cualquiera que sea el valor observado de y, Lip) se maximiza 
cuando p = y/n. 

El MLE, p = Yl n, es la fraccion de exitos en el numero total de intentos n. Por tanto, el 
MLE de p es en realidad el estimador intuitivo para p que usamos en todo el Capftulo 8. ■ 


EJ E M P L O 9.1 5 Sea Y X ,Y 2 ,... ,Y n una muestra aleatoria de una distribucion normal con media p y varianza 
cr 2 . Encuentre los estimadores de maxima verosimilitud (MLE) de p. y cr 2 . 

Solucion Como Y v Y 2 , , Y n son variables aleatorias continuas. Lip., cr 2 ) es la densidad conjunta de 

la muestra. Asf, L ip, cr 2 ) = f(y i, y 2 , ..., y n \ p, v 2 )- En este caso. 


Lip, o- 2 ) = f(y i, y 2 ,...,y„\p, cr 2 ) 


= f(y l | o- 2 ) X f(y 2 \p,cr 2 ) X ■■■Xf(y„\p, cr 2 ) 


[ 1 

r-(yi -p) 2 1 

) ^ [1 

"-( y n - p) 2 T 

1 /^— ex p 

[aylrr 

2 cr 2 

> A ^ | r- - 

2 cr 2 


Ittct 1 


„/2 


exp 


-1 
2 o -2 


X]( yi - m ) 2 


[Recuerde que exp(w) es solo otra forma de escribir e"'.] Ademas, 

Yy.Yi ~ PP 2 - 

i = 1 

Los MLE de p y cr 2 son los valores que hacen ln[L (p, cr 2 ) un maximo. Evaluando derivadas 
con respecto a p y cr 2 , obtenemos 

d{ln[L(p, cr 2 )]} 1 


r- 'f -i H rt Yl 1 

In [Lip, o- 2 )] = —— In cr 2 - -ln27r - — 
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y 


d{ln[L(fi, o- 2 )]} 
da 2 



+ ^X>“^ )2 - 

° i=i 


Igualando a cero estas derivadas y resolviendo simultaneamente, obtenemos de la primera 
ecuacion 


j n n i n 

“ A) = °. o -nfi= 0, y fi = - =y. 

a i=i i=i ” i=i 

Sustituyendo y por /i en la segunda ecuacion y despejando cr, tenemos 







Entonces, Y y a 2 = ^ Yl'i = i ( — 10 2 son los MLE de /i y cr 2 , respectivamente. Observe que 
K es insesgada para /a. Aun cuando cr 2 no esta insesgada para cr 2 , se puede ajustar facilmente 
al estimador insesgado .S' 2 (vea el Ejemplo 8.1). ■ 


EJEMPLO 9.16 Sea >j, K 2 , . . . , Y n una muestra aleatoria de observaciones de una distribucion uniforme 
con funcion de densidad de probabilidad/(v,| 0) =1/0, para 0 < y ; < 0 e i = 1, 2, . . . , n. 
Encuentre el MLE de 0. 


Solucion En este caso, la verosimilitud esta dada por 


m 


f(y i, yi, y«|0) 


1 1 
- x - x- 
0 0 

0, 


1 

• X 0 


= f(yi I 0) x /(y 2 1 0) x • • • x /(y„ | 0) 

= —, si 0 < y ; < 0, i =1,2,..., n, 
0" 7 

en cualquier otro punto. 


Obviamente, L(0) no esta maximizado cuando L(6) = 0. Usted notara que 1/0" es una funcion 
de 0 que decrece en forma monotonica. Por tanto, en ninguna parte del intervalo 0 < 0 < oo es 
d[l/0"]/d0 igual a cero. No obstante, 1 /0" aumenta cuando 0 disminuye y 1/0" se maximiza 
al seleccionar 0 tan pequena como sea posible, sujeto a la restriccion de que todos los valores 
de y, esten entre 0 y 0. El valor mas pequeno de 0 que satisface esta restriccion es la maxima 
observacion del conjunto y v y 2 , . . . , y n . Esto es, 0 = Y (ll) = max( Y\, Y 2 ,..., Y„) es el MLE 
para 0. Este MLE para 0 no es un estimador insesgado de 0, pero se puede ajustar para ser 
insesgado, como se muestra en el Ejemplo 9.1. ■ 


Hemos visto que los estadisticos suficientes que mejor resumen los datos tienen propie- 
dades deseables y con frecuencia se pueden usar para determinar un estimador insesgado de 
varianza minima (MVUE) para parametros de interes. Si U es cualquier estadlstico suficiente 
para la estimacion de un parametro 0, incluyendo el estadlstico suficiente obtenido del uso 
optimo del criterio de factorizacion, el MLE es siempre alguna funcion de U. Esto es, el MLE 
depende de las observaciones muestrales solo mediante el valor de un estadlstico suficiente. 
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EJEMPLO 9.17 

Solucion 


Para demostrar esto, solo necesitamos observar que si U es un estadfstico suficiente para 0, 
el criterio de factorizacion (Teorema 9.4) implica que la verosimilitud puede ser factorizada 
como 


L{9) = L(yi, yi,..., y„\0) = g{u, 9) h(y u y 2 ,..., y n ), 


donde g(u, 9) es una funcion de solo it y 9 y h ( vj, y 2 , . . . , y n ) no depende de 9. Por tanto, se 
deduce que 


ln[L(0)] =ln[g( M ,0)] +\n[h(y u yi,..., y„)l 


Observe que ln[/i(yj, y 2 , . . . , >'„)] no depende de 9 y por tanto maximizar ln[L(0)] con res- 
pecto a 9 es equivalente a maximizar ln[g(w, 0)] con respecto a 9. Como \n[g(u, 0)] depende 
de los datos solo mediante el valor del estadfstico suficiente U, el MLE para 0 es siempre 
alguna funcion de U. En consecuencia, si un MLE para un parametro se puede hallar y luego 
ajustar para ser insesgado, el estimador resultante es con frecuencia un MVUE del parametro 
en cuestion. 

Los MLE tienen algunas propiedades adicionales que hacen que este metodo de estimacion 
sea particularmente atractivo. En el Ejemplo 9.9 consideramos la estimacion de 0 2 , una fun¬ 
cion del parametro 0. Funciones de otros parametros tambien pueden ser de interes. Por ejem¬ 
plo, la varianza de una variable aleatoria binomial es np (1 - p), una funcion del parametro p. 
Si Y tiene una distribution de Poisson con media A, se deduce que P(Y = 0) = e -A ; podemos 
desear calcular esta funcion de A. En general, si 0 es el parametro asociado con una distribu¬ 
cion, en ocasiones estamos interesados en calcular alguna funcion de 0, por ejemplo t(9), en 
lugar de 0 misma. En el Ejercicio 9.94 usted demostrara que si t(d) es una funcion biunfvoca 
de 0 y si 0 es el MLE para 0, entonces el MLE de t(6) esta dado por 


m = m. 


Este resultado, a veces conocido como la propiedad de invarianza de los MLE, tambien se 
cumple para cualquier funcion de un parametro de interes (no solo funciones biunfvocas). 
Veanse mas detalles en la obra de Casella y Berger (2002). 


En el Ejemplo 9.14, encontramos que el estimador de maxima verosimilitud (MLE) de una 
proporcion binomial p esta dado por p = Yin. (j Cual es el MLE para la varianza de K? 

La varianza de una variable aleatoria binomial Y esta dada por V (Y) = np (1 — p). Como V (Y) 
es una funcion del parametro binomial p, por ejemplo, V(Y) = t(p) con tip ) = np (1 — p), se 
deduce que el MLE de ViY) esta dado por 



Este estimador no esta insesgado, pero, usando el resultado del Ejercicio 9.65, podemos facil- 
mente ajustarlo para hacerlo insesgado. En realidad, 


EJEMPLO 9.17 

Solucion 



es el estimador insesgado linico de varianza minima (UMVUE) para tip) = np(l — p). 
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En la siguiente section (optional), resumimos algunas de las propiedades utiles y conve- 
nientes de los MLE con muestras grandes. 


Ejercicios 


9.80 Suponga que Yi. Y* ■ ■ ■ , Y„ denotan una muestra aleatoria de la distribucion de Poisson con media A. 
a Encuentre el MLE A para A. 

b Encuentre el valor esperado y la varianza de A. 
c Demuestre que el estimador del inciso a es consistente para A. 
d iCual es el MLE para P(Y = 0) = e ~ A ? 

9.81 Suponga que Y v Y 2 ,... , Y n denotan una muestra aleatoria de una poblacion distribuida exponencialmente 
con media 8. Encuentre el MLE de la varianza poblacional 8 1 . [Sugerencia: recuerde el Ejemplo 9.9.] 

9.82 Sea 7,, 7,, . . . , Y n una muestra aleatoria de la funcion de densidad dada por 


f(y I e) = 


0 , 


8 > 0, y > 0, 
en cualquier otro punto. 


donde r es una constante positiva conocida. 
a Encuentre un estadfstico suficiente para 8. 
b Encuentre el MLE de 8. 

c ^,E1 estimador del inciso b es un MVUE para 87 

9.83 Suponga que Y v Y 2 , . .., Y n constituyen una muestra aleatoria de una distribucion uniforme con funcion 
de densidad de probabilidad 


f(y 1 0) 


l 

28 + 1 ’ 

0, 


0 <y <20 + 1, 
en cualquier otro punto. 


a Obtenga el MLE de 8. 

b Obtenga el MLE para la varianza de la distribucion subyacente. 

9.84 Cierto tipo de componente electronico tiene una duration 7 (en horas) con funcion de densidad de pro¬ 
babilidad dada por 


fiy 1 0) = 



l o. 


y > 0, 

en cualquier otro punto. 


Esto es, 7 tiene una distribucion gamma con parametros a = 2 y 8. Con 8 denote el MLE de 8. Suponga 
que tres de tales componentes, probados independientemente, tuvieron duraciones de 120, 130 y 128 
horas. 

a Encuentre el MLE de 8. 
b Encuentre £(0) y V(0). 

c Suponga que 8 en realidad es igual a 130. Proporcione un llmite aproximado que pudiera esperarse 
para el error de estimation, 
d ^Cual es el MLE para la varianza de 7? 
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9.85 


Sean Y v Y 2 , 


Y n una muestra aleatoria de la funcion de densidad dada por 


f(y \a, 8) = 


\r (a)e a 

o, 


ya-l e - y i0' 


y > 0, 

en cualquier otro punto. 


donde a > 0 es conocida. 


a Encuentre el MLE 8 de 8. 
b Encuentre el valor esperado y la varianza de 0. 
c Demuestre que 8 es consistente para 8. 

d ^Cual es el mejor (mmimo) estadfstico suficiente para 8 en este problema? 

e Suponga que n = 5 y a = 2. Use el mmimo estadfstico suficiente para construir un intervalo de con- 
fianza de 90% para 8. [Sugerencia: transforme en una distribucion x 2 .] 

9.86 Suponga que A), X 2 , . . . , X m , que representan la produccion por acre para la variedad A de mafz, cons- 
tituyen una muestra aleatoria de una distribucion normal con media /jl 1 y varianza cr. Tambien, Y t , Y 2 , . 
. . , Y n , que representan la produccion para la variedad B de mafz, constituyen una muestra aleatoria de 
una distribucion normal con media p, 2 y varianza a 2 . Si las X y las Y son independientes, encuentre el 
MLE para la varianza comun cr 2 . Suponga que p. l y pc 2 son desconocidas. 

9.87 Una muestra aleatoria de 100 votantes seleccionados de una poblacion grande revelo que 30 estan a fa¬ 
vor del candidato A, 38 a favor del candidato B y 32 a favor del candidato C. Encuentre los MLE para las 
proporciones de votantes en la poblacion que estan a favor de los candidatos A, B y C, respectivamente. 
Calcule la diferencia entre las fracciones que estan a favor de A y B y ponga un lfmite de desviacion 
estandar de 2 en el error de estimacion. 


9.88 


Sea Yj, Y 2 ,..., Y n una muestra aleatoria de la funcion de densidad de probabilidad 


f(y |0) = 


(6 + 1)/, 0 < y < 1, 8 > -1, 

0, en cualquier otro punto. 


Encuentre el MLE para 8. Compare su respuesta con el estimador del metodo de momentos hallado en 
el Ejercicio 9.69. 

9.89 Se sabe que la probabilidad p de obtener una cara al lanzar al aire una moneda desbalanceada es 1/4 o 
3/4. La moneda es lanzada dos veces al aire y se observa un valor para Y, el numero de caras. Para cada 
valor posible de Y, ^,cual de los dos valores para p (1/4 o 3/4) maximiza la probabilidad de que Y = y? 
Dependiendo del valor de y observado realmente, ^cual es el MLE de p? 

9.90 Veinticinco hombres que forman parte de una muestra aleatoria de 100 hombres estan a favor de una 
controvertida propuesta. De una muestra aleatoria independiente de 100 mujeres, un total de 30 estaban 
a favor de la propuesta. Suponga que p M es la verdadera proporcion subyacente de hombres que estan a 
favor de la propuesta y que p w es la verdadera proporcion subyacente de mujeres que estan a favor de la 
propuesta. Si en realidad es cierto que p w = p M = p, encuentre el MLE de la proporcion comun p. 

*9.91 Encuentre el MLE de 8 con base en una muestra aleatoria de tamano n de una distribucion uniforme en 
el intervalo (0, 28). 


*9.92 Sea Y } , Y 2 , . . . 


Y n una muestra aleatoria de una poblacion con funcion de densidad 

3y 2 

. 0, en cualquier otro punto. 


f(y |0) = 


En el Ejercicio 9.52 se demostro que = max(Y[, Y 2 , . . . , Y n ) es suficiente para 8. 
a Encuentre el MLE para 8. [Sugerencia: vea el Ejemplo 9.16.] 

b Encuentre una funcion del MLE en el inciso a que sea una cantidad pivote. [Sugerencia: vea el 
Ejercicio 9.63.] 

c Use la cantidad pivote del inciso b para determinar un intervalo de confianza de 100(1 - a)% para 8. 
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*9.93 


*9.94 


Sea Y l , Y 2 , . . . , Y n una muestra aleatoria de una poblacion con funcion de densidad 

26 1 

f(y 10) = ' 


9 < y < 00 , 


0, en cualquier otro punto. 

En el ejercicio 9.53 se demostro que Y ^ = mfn(T|, Y 2 , . . . , L n ) es suficiente para 9. 
a Encuentre el MLE para 9. [Sugerencia: vease el ejemplo 9.16.] 


b Encuentre una funcion del MLE obtenido en el inciso a que sea una cantidad pivote. 
c Utilice la cantidad pivote obtenida en el inciso b para encontrar un intervalo de confianza de 100 
( 1- a)% para 9. 


Suponga que 9 es el MLE para un parametro 9. Sea t(9) una funcion de 9 que posee una inversa unica 
[es decir, si j8 = t(9), entonces 9 = t _1 (/3)]. Demuestre que t(9) es el MLE de t(9). 


*9.95 Una muestra aleatoria de n piezas se selecciona de entre un ntimero grande de piezas producidas por 
cierta lfnea de production en un dia. Encuentre el MLE de la relation R, la proportion de piezas defec- 
tuosas dividida entre la proportion de piezas buenas. 

9.96 Considere una muestra aleatoria de tamano n de una poblacion normal con media /x y varianza cr 2 , pero 
desconocida. Deduzca el MLE de cr. 


9.97 La funcion de masa de probabilidad geometrica esta dada por 


p(yifip) =pd ~pY~\ y = 1,2,3,... 

Una muestra aleatoria de tamano n se toma de una poblacion con una distribution geometrica. 

a Encuentre el estimador del metodo de momentos para p. 
b Encuentre el estimador de maxima verosimilitud (MLE) para p. 


9.8 Algunas propiedades de los 

estimadores de maxima verosimilitud 
con muestras grandes (opcional) 


Los estimadores de maxima verosimilitud tambien tienen propiedades interesantes cuando se 
trabaja con muestras grandes. Suponga que t(0) es una funcion derivable de 6. En la Section 
9.7 afirmamos por la propiedad de invarianza que si 0 es el MLE de 9, entonces el MLE de t(0) 
esta dado por t(9). En algunas condiciones de regularidad que se cumplen para las distribu- 
ciones que consideraremos, t{9) es un estimador consistente para t (6). Ademas, para tamanos 
muestrales grandes, 


Z = 


m - m 


pr(0)] 

1 / U 

L d9 

/ nE 


a 2 In f(Y | 9) 

' W 


tiene aproximadamente una distribution normal estandar. En esta expresion, la cantidad / 
( Y\ 9) del denominador es la funcion de densidad correspondiente a la distribution continua 
de interes, evaluada en el valor aleatorio Y. En el caso discreto, el resultado analogo se cum- 
ple con la funcion de probabilidad evaluada en el valor aleatorio Y, p (Y\ 9) se sustituye por 
la densidad/(L | 9). Si deseamos un intervalo de confianza para t (9), podemos usar a Zcomo la 
cantidad pivote. Si continuamos como en la Section 8.6, obtenemos el siguiente intervalo de 
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EJEMPLO 9.18 


Solucion 


confianza aproximado de muestra grande 100(1 - a)% para t (6): 
t(h ± Zal 2 


N L 


dt(0) 


-i2 


de 


nE 


3 2 In f(Y\0) 


dO 2 


t(0) ± Z a /2 


N 


dt(0) 

do 


nE 


d 2 In f(Y \ 9) 
' dO 2 


0=0 


Ilustramos esto con el siguiente ejemplo. 


Para una variable aleatoria con distribucion de Bernoulli, p (y \p) = p y (1 - p)'~ } , para y = 0, 
1. Si K|, Y 2 ,, Y n denotan una muestra aleatoria de tamano n de esta distribucion, deduzca 
un intervalo de confianza de 100(1 - a)% para p( I - p), la varianza asociada con esta distri¬ 
bucion. 


A1 igual que en el Ejemplo 9.14, el MLE del parametro p esta dado por p = W/ n donde 
W = i Yi- deduce que el MLE para t(p) = p{\ — p) es t(p) = p( 1 — p). 

En este caso, 


Tambien, 


t(p)=p ( l-p) = p-p 2 y d J±Pl = l- 2 p. 

dp 


p(y I p) = p y (i ~ p) l ~ y 
In [P (y I P)] = ,v(ln p) + (1 - y) ln( 1 - p) 
d In [p(y | p)] = y_ _ 1 ~ y 
P 1 ~ P 


dp 

d 2 \n[p(y\p)] 
dp 2 

d 2 In [p{Y | p)] 
dp 2 


y 


= E 


__ _ i -y 

p 2 (i - p) 2 
Y 1 - Y 

p 1 (1 - p) 2 


P 1 ~p 1 

— —o + -— — — + 

.2 (! p)2 


1 


1 


p“ (t - pr p i - p p (i - p) 

Sustituyendo en la formula anterior para el intervalo de confianza para t(9), obtenemos 


t(P) ± Za/2 


N 


'dt(p)' 

. dp 


nE 


d 2 In p(Y | p)' 

~W- . 


p=p 


= P( 1 - p)± Za/2 
= P(1 - P) ± Za/2 


(1 -2 p) 2 


/„ r_^_ 11 

/ Lpo-piJI 


Pi 1 “ P)(l - 2 p) 2 


como el intervalo de confianza deseado para p{ 1 —p). 
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Ejercicios 

*9.98 Consulte el Ejercicio 9.97. ( ',Cua] es la varianza aproximada del estimador de maxima 
verosimilitud? 

*9.99 Considere la distribucion estudiada en el Ejemplo 9.18. Use el metodo presentado en la 
Seccion 9.8 para deducir un intervalo de confianza de 100(1 - a)% para tip) = p. (i EI 
intervalo resultante le es conocido? 

*9.100 Suponga que Vj, Y 2 , , Y n constituyen una muestra aleatoria de tamaiio n de una dis¬ 

tribucion exponencial con media A. Encuentre un intervalo de confianza de 100(1 - a)% 
para t(0) = 0 2 . 

*9.101 Sea Y v Y 2 , . . . , Y n una muestra aleatoria de tamaiio n de una distribucion de Poisson 
con media A. Encuentre un intervalo de confianza de 100(l-a)% para t (A) = = P 

(Y = 0). 

*9.1 02 Consulte los Ejercicios 9.97 y 9.98. Si una muestra de tamaiio 30 da v = 4.4, encuentre 
un intervalo de confianza de 95% para p. 


9.9 Resumen 

En este capitulo continuamos y ampliamos el tema de estimacion iniciado en el Capitulo 
8. Los buenos estimadores son consistentes y eficientes cuando se comparan contra otros 
estimadores. Los estimadores mas eficientes, los que tienen las varianzas mas pequenas, son 
funciones de los estadisticos suficientes que mejor resumen toda la informacion acerca del 
parametro de interes. 

Se presentaron dos metodos para determinar estimadores, el metodo de momentos y el 
metodo de maxima verosimilitud. Los estimadores de momento son consistentes pero por lo 
general no son muy eficientes. Los MLE, por otro lado, son consistentes y, si se ajustan para 
ser insesgados, con frecuencia llevan a estimadores insesgados de minima varianza. Como 
tienen muy buenas propiedades, los MLE se usan con frecuencia en la practica. 
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Capftulo 9 Propiedades de los estimadores puntuales y metodos de estimation 


Ejercicios complementarios 


9.103 Una muestra aleatoria de tamano n se toma de una poblacion con una distribution de Rayleigh. A1 igual 
que en el Ejercicio 9.34, la funcion de densidad de Rayleigh es 


/ O') = 


2y\ - 


-rm 


0 , 


y > 0, 


en cualquier otro punto. 


a Encuentre el estimador de probabilidad maxima de 8. 

*b Encuentre la varianza aproximada del estimador de maxima verosimilitud obtenido en el inciso a. 

9.104 Suponga que Y v Y 2 , . . . , Y n constituyen una muestra aleatoria de la funcion de densidad 


/O' I e) 


y>8, 

10, en cualquier otro punto 


donde 8 es una constante positiva desconocida. 
a Encuentre un estimador 8\ para 8 por el metodo de momentos. 
b Encuentre un estimador 8 2 para 8 por el metodo de maxima verosimilitud. 

c Ajuste 8i y d 2 P ara que sean insesgados. Encuentre la eficiencia de la 8i ajustada con respecto a la d 2 
ajustada. 

9.105 Consulte el Ejercicio 9.38(b). En las condiciones ahi senaladas, encuentre el MLE de a 2 . 

*9.106 Suponga que Pj, Y 2 , . . . , Y n denotan una muestra aleatoria de una distribution de Poisson con media A. 

Encuentre el estimador insesgado de varianza minima (MVUE) de P (Pj = 0) = e~ x . [Sugerencia: haga 
uso del teorema de Rao-Blackwell.] 

9.107 Suponga que se toma una muestra aleatoria de mediciones de vida util, Pj, Y,, . .., Y n , de componentes 
cuya duration tiene una distribution exponencial con media 8. Con frecuencia resulta de interes esti- 
mar 

F(t) = 1 - F(t) = e~" e , 

la confiabilidad en el tiempo t de dicho componente. Para cualquier valor fijo de f, encuentre el MLE de 

Fit). 

*9.108 El MLE obtenido en el Ejercicio 9.107 es una funcion del estadlstico suficiente mlnimo para 8, pero no 
es insesgado. Use el teorema de Rao-Blackwell para determinar el MVUE de e~F e mediante los siguien- 
tes pasos: 

a Sea 

Yi > t, 

en cualquier otro punto. 

Demuestre que V es un estimador insesgado de e~F e . 

b Como U = Y^= i Z es e l estadlstico suficiente mlnimo para 8, demuestre que la funcion de densidad 
conditional para Jj, dada U = u,e s 

f , \(- —r)(«-yi)"“ 2 , o <yi<u, 

fr l \u(y \| U)= <\ U n ~ 1 ) 

l 0, en cualquier otro punto. 

c Demuestre que 
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*9.109 


*9.110 


*9.111 


9.112 


Este es el MVUE de t por el teorema de Rao-Blackwell y por el hecho de que la funcion de den- 
sidad para U esta completa. 

Suponga que n enteros se sacan al azar y con reemplazo de los enteros 1, 2,.... N. Esto es, cada entero 
muestreado tiene probabilidad l/N de tomar cualquiera de los valores 1, 2, .... IV y los valores mues- 
treados son independientes. 

a Encuentre el estimador de metodo de momentos de N. 
b Encuentre E(N t ) y V(lVi). 

Consulte el Ejercicio 9.109. 
a Encuentre el MLE N 2 de N. 

b Demuestre que E(N 2 )e s aproximadamente [n/(n + 1 )]N. Ajuste N 2 para formar un estimador IV 3 que 
sea aproximadamente insesgado para N. 

c Encuentre una varianza aproximada para N 3 usando el hecho de que para N grande la varianza del 
maximo entero muestreado es aproximadamente 

nN 2 

(n + 1 ) 2 (n + 2)' 

d Demuestre que para N grande y n > 1, V(N 3 ) < V(N 1 ). 

Consulte el Ejercicio 9.110. Suponga que tanques enemigos tienen ntimeros de serie 1,2 , . . . , N. Un 
espia observo al azar cinco tanques (con reemplazo) con numeros de serie 97, 64, 118, 210 y 57. Calcule 
N y ponga un limite en el error de estimacion. 

Sean Y l , Y 2 , . . ., Y n una muestra aleatoria de una distribucion de Poisson con media A y defina 



a Demuestre que la distribucion de W lt converge en una distribucion normal estandar. 

b Utilice W n y el resultado del inciso a para deducir la formula para un intervalo de confianza aproxi- 
mado de 95% para A. 




CAPITULO 10 


Prueba de hipotesis 

10.1 Introduccion 

10.2 Elementos de una prueba estadfstica 

10.3 Pruebas comunes con muestras grandes 

10.4 Calculo de las probabilidades del error tipo II y determinacion 
del tarnano muestral para la prueba Z 

10.5 Relaciones entre los procedimientos de pruebas de hipotesis 
e intervalos de confianza 

10.6 Otra forma de presentar los resultados de una prueba estadfstica: 
niveles de significancia alcanzados o valores p 

10.7 Algunos comentarios respecto a la teorfa de la prueba de hipotesis 

10.8 Prueba de hipotesis con muestras pequenas para p y p,, — p 2 

10.9 Pruebas de hipotesis referentes a varianzas 

10.10 Potencia de las pruebas y el lema de Neyman-Pearson 

10.11 Pruebas de razon de probabilidad 

10.12 Resumen 

Bibliograffa y lecturas adicionales 


10.1 Introduccion 

Recuerde que a menudo uno de los objetivos de la estadfstica es hacer inferencias acerca de 
parametros poblacionales desconocidos con base en information contenida en datos mues- 
trales. Estas inferencias se interpretan de dos formas: como estimaciones de los parametros 
respectivos o como pruebas de hipotesis acerca de sus valores. Los Capftulos 8 y 9 se refieren 
a la estimation; en este capftulo examinamos el tema general de pruebas de hipotesis. 

En muchos aspectos, el procedimiento formal para pruebas de hipotesis es semejante al me- 
todo cientffico. Este observa la naturaleza, formula una teorfa y la confronta con lo observa- 
do. En nuestro contexto, el cientffico plantea una hipotesis respecto a uno o mas parametros 
poblacionales: de que son iguales a valores especificados. En seguida toma una muestra de la 
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poblacion y compara sus observaciones con la hipotesis. Si las observaciones no concuerdan 
con la hipotesis, las rechaza. De lo contrario, concluye que la hipotesis es verdadera o que la 
muestra no detecto la diferencia entre los valores real e hipotetico de los parametros poblacio- 
nales. 

Por ejemplo, un investigador medico puede plantear la hipotesis de que un nuevo medica- 
mento es mas eficaz que otro para combatir una enfermedad. Para probarla, selecciona aleato- 
riamente pacientes infectados con la enfermedad y los divide en dos grupos. El nuevo medi- 
camento A se administra a los pacientes del primer grupo y el B a los del segundo. Entonces, 
con base en el numero de pacientes de cada grupo que se recuperen de la enfermedad, el 
investigador decide si el nuevo medicamento es mas eficaz que el anterior. 

Las pruebas de hipotesis se llevan a cabo en todos los campos en los que la teorfa se pueda 
probar contra observacion. Un ingeniero de control de calidad puede plantear la hipotesis 
de que un nuevo metodo de ensamble produce solo 5% de piezas defectuosas. Un educador 
puede decir que dos metodos de ensenanza de lectura son igualmente eficaces, o un candidato 
politico afirmar que la mayorfa de los votantes esta a favor de el. Todas estas hipotesis pueden 
ser tema de verificacion estadfstica mediante el uso de datos muestrales observados. 

( ,CuaI es el papel de la estadfstica en pruebas de hipotesis? Dicho sin rodeos, ^para que sir- 
ve la estadfstica en este procedimiento de pruebas de hipotesis? Probar una hipotesis requiere 
tomar una decision cuando se compara la muestra observada contra la teorfa. - Como decidi- 
mos si la muestra no concuerda con la hipotesis del cientffico? ^ Cuando debemos rechazar la 
hipotesis, cuando debemos aceptarla y cuando no revelar el juicio? <,Cual es la probabilidad de 
que tomemos una mala decision y, en consecuencia, sufrir una perdida? Y, en particular, ( 'C|ue 
funcion de las mediciones muestrales debe emplearse para llegar a una decision? Las respues- 
tas a estas preguntas estan contenidas en un estudio de pruebas de hipotesis estadfsticas. 

El Capftulo 8 introdujo el tema general de estimacion y presento algunos procedimientos 
de estimacion intuitivos. El Capftulo 9 presento unas propiedades de estimadores y metodos 
formales para obtener estimadores. Usamos el mismo metodo en nuestra exposicion de prueba 
de hipotesis, es decir, introducimos el tema, presentamos procedimientos de prueba intuitivos 
y luego consideramos algunos metodos formales para deducir procedimientos de prueba de 
hipotesis estadfstica. 


10.2 Elementos de una prueba estadfstica 

Muchas veces, el objetivo de una prueba estadfstica es probar una hipotesis concerniente 
a los valores de uno o mas parametros poblacionales. Por lo general tenemos una teorfa, 
es decir una hipotesis de investigation, acerca del o los parametros que deseamos apoyar. 
Por ejemplo, suponga que un candidato, Jones, dice que el ganara mas de 50% de los votos 
en una eleccion urbana y por tanto saldra como ganador. Si no creemos en lo dicho por 
Jones, podrfamos buscar apoyar la hipotesis de investigacion de que Jones no esta siendo 
favorecido por mas de 50% del electorado. El apoyo para esta hipotesis de investigacion, 
tambien llamada hipotesis alternativa, se obtiene mostrando (usando los datos muestrales 
como evidencia) que lo contrario de la hipotesis alternativa, llamado hipotesis nula, es falso. 
Entonces, una teorfa se comprueba demostrando que no hay evidencia que sustente la teorfa 
opuesta: en cierto sentido, una prueba por contradiction. Como buscamos apoyo para la 
hipotesis alternativa de que lo dicho por Jones es falso, nuestra hipotesis alternativa es que 
p, la probabilidad de seleccionar un votante que este a favor de Jones, es menor que .5. Si 
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podemos demostrar que los datos apoyan el rechazo de la hipotesis nula p = .5 (el valor mf- 
nimo necesario para una conseguir una mayoria) en favor de la hipotesis alternativa p < .5, 
hemos alcanzado nuestro objetivo de investigacion. Aun cuando es comun hablar de probar 
una hipotesis nula, el objetivo de investigacion suele ser demostrar apoyo para la hipotesis 
alternativa, si dicho apoyo se justifica. 

(.Como usamos esos datos para decidir entre la hipotesis nula y la hipotesis alternativa? 
Suponga que n = 15 votantes se seleccionan aleatoriamente de una ciudad y se registra Y, el 
numero que esta a favor de Jones. Si nadie en la muestra esta a favor de Jones (Y = 0), ( ',que' 
se concluirfa acerca de lo dicho por Jones? Si Jones en realidad es favorecido por mas de 50% 
del electorado, no es imposible observar que Y = 0 estan a favor de Jones en una muestra 
de tamano n = 15, pero es altamente improbable. Es mucho mas probable que observemos 
Y = 0 si la hipotesis alternativa fuera cierta. Entonces, rechazarfamos la hipotesis nula (p = .5 
a favor de la hipotesis alternativa (p < .5). Si observamos Y = I (o cualquier valor pequeno 
de Y), un razonamiento analogo nos lleva a la misma conclusion. 

Cualquier prueba de hipotesis estadfstica funciona exactamente de la misma forma y esta 
compuesta de los mismos elementos esenciales. 


Los elementos de una prueba estadfstica 

1. Hipotesis nula, H 0 

2. Hipotesis alternativa, H a 

3. Estadfstico de prueba 

4. Region de rechazo 


Para nuestro ejemplo, la hipotesis a ser probada, llamada hipotesis nula y denotada por H 0 , 
es p = .5. La hipotesis alternativa (o investigacion), denotada como H a , es la hipotesis a ser 
aceptada en caso que H 0 sea rechazada. Por lo general la hipotesis alternativa es la que quere- 
mos comprobar con base en la information contenida en la muestra; asf, en nuestro ejemplo, 
H a esp< .5. 

Las partes esenciales de una prueba estadfstica son el estadfstico de prueba y una region de 
rechazo asociada. El estadistico de prueba (al igual que un estimador) es una funcion de las me- 
diciones muestrales (Y en nuestro ejemplo) en las que la decision estadfstica estara basada. La 
region de rechazo, que de aquf en adelante estara denotada por RR, especifica los valores del 
estadfstico de prueba para el cual la hipotesis nula ha de ser rechazada a favor de la hipotesis 
alternativa. Si, para una muestra particular, el valor calculado del estadfstico de prueba cae en 
la region de rechazo RR, rechazamos la hipotesis nula H 0 y aceptamos la hipotesis alternativa 
H a . Si el valor del estadfstico de prueba no cae en la RR, aceptamos H 0 . Como ya indicamos 
antes, para nuestro ejemplo pequenos valores de Y nos llevarfan a rechazar H 0 . Por tanto, una 
region de rechazo que podrfamos considerar es el conjunto de todos los valores de Y menores 
o iguales a 2. Usaremos la notation RR = {y: y < 2}, o bien, dicho de una forma mas sencilla, 
RR = {y < 2} para denotar esta region de rechazo. 

Hallar una buena region de rechazo para una prueba estadfstica es un problema interesante 
que amerita mas atencion. Es evidente que pequenos valores de Y, por ejemplo y < k (vea la 
Figura 10.1), son contradictories para la hipotesis H 0 : = .5 pero favorables para la alternativa 
H a : p < .5. Entonces de manera intuitiva seleccionamos la region de rechazo como RR = {y 
< k}. Pero, ,:t|lie valor debemos escoger para kl En forma mas general, buscamos algunos 




10.2 Elementos de una prueba estadfstica 491 


FIGURA 10.1 

Region de rechazo, 
RR = {y < k], para 
una prueba de la 
hipotesis H 0 : p — .5 
contra la alternativa 
H-. p < .5 


Region de 
rechazo, RR 
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criterios objetivos para decidir cual valor de k especifica una buena region de rechazo de la 
forma {y < k}. 

Para cualquier region de rechazo fija (determinada por un valor particular de k ), dos tipos 
de errores se pueden cometer al llegar a una decision. Podemos decidir a favor de H a cuando 
H 0 es verdadera ( error tipo 1), o podemos decidir a favor de H 0 cuando H a es verdadera ( error 
tipo II). 


DEFINICION 10.1 Se comete un error tipo I si H 0 es rechazada cuando H 0 es verdadera. La probabilidad 
de un error tipo I esta denotada por a. El valor de a se denomina nivel de la prueba. 

Se comete un error tipo II si H 0 es aceptada cuando H a es verdadera. La probabilidad 
de un error tipo II esta denotada por (I. 


Para la encuesta polftica de Jones, cometer un error tipo I, es decir rechazar H 0 : p = .5 (y 
por tanto aceptar H a : p < .5) cuando de hecho H 0 es verdadera, significa concluir que Jones 
perdera cuando en realidad va a ganar. En contraste, cometer un error tipo II significa aceptar 
H 0 : p = .5 cuando p < .5 y concluir que Jones ganara cuando en realidad va a perder. Para 
casi todas las situaciones reales, las decisiones incorrectas cuestan dinero, prestigio o tiempo e 
implican una perdida. Entonces, a y /3, las probabilidades de cometer estos dos tipos de error, 
miden los riesgos relacionados con las dos posibles decisiones erroneas que podrian resultar 
de una prueba estadfstica. Como tales, proporcionan una forma muy practica de medir la 
bondad de una prueba. 


EJEMPLO 10.1 Para la encuesta polftica de Jones se muestrearon n = 15 votantes. Deseamos probar 
H 0 :p = .5 contra la alternativa, H a : p < .5. El estadfstico de prueba es Y, el numero de votan¬ 
tes muestreados a favor de Jones. Calcule a si seleccionamos RR = {y < 2} como la region 
de rechazo. 

Solucion Por dehnicion, 

a = P (error tipo I) = P (rechazar H 0 cuando H 0 es verdadera) 

= P (valor del estadfstico de prueba esta en RR cuando H 0 es verdadera) 

= P (7 < 2 cuando p = .5). 

Observe que Y es una variable aleatoria binomial con n = 15. Si H 0 es verdadera, p = .5 y 
obtenemos 



C5) y (.5) 


15—y 



(-5) 15 + 



(.5) 15 + 



(-5) 15 . 


a 
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Usando la Tabla 1 del Apendice 3 para evitar este calculo, encontramos a = .004. Entonces, si 
decidimos usar la region de rechazo RR = {y < 2}, asumimos un riesgo muy pequeno (a = 
.004) de concluir que Jones perdera si en realidad es el ganador. ■ 


EJEMPLO 10.2 Consulte el Ejemplo 10.1. ^Nuestra prueba es tan buena como para evitar concluir que Jones 
va a ganar si en realidad perdera? Suponga que el recibira 30% de los votos ip = .3). <Cual es 
la probabilidad /3 de que la muestra erroneamente nos lleve a concluir que H 0 es verdadera y 
que Jones v<a a ganar? 

Solucion Por definition, 

[3 = P (error tipo II) = P (aceptar H 0 cuando H a es verdadera) 

= P (el valor del estadfstico de prueba no esta en RR cuando H a es verdadera). 
Como buscamos calcular /3 cuando p = .3 (un valor particular de p que esta en Hj, 

15 /15\ 

/3 = P(Y> 2 cuando p = .3) = ^ I j(.3) > ’(.7) I5 ~ y . 

y=3 v y / 

De nuevo, consultando la Tabla 1, Apendice 3, encontramos que [3 = .873. Si usamos RR = 
{y s 2}, nuestra prueba por lo general nos llevara a concluir que Jones es ganador (con pro¬ 
babilidad jS = .873), aun cuando p tan bajo comop = .3. ■ 


El valor de f3 depende del verdadero valor del parametro p. Cuanto mayor sea la diferencia 
entre p y el valor hipotetico (nulo) de p = .5, menor es la verosimilitud de que no rechacemos 
la hipotesis nula. 


EJEMPLO 10.3 Consulte los Ejemplos 10.1 y 10.2. Calcule el valor de f3 si Jones recibira solo 10% de los 
votos (p = .1). 

Solucion En este caso, deseamos calcular (3 cuando p = . 1 (otro valor particular de p en //J. 

(3 = P (error tipo II) = P (aceptar H 0 cuando p = .1) 

= P (el valor del estadfstico de prueba no esta en RR cuando p = .1) 

= P (F> 2 cuando p = .1) = ^V. 1) 3 ’(.9) 15—y = .184. 

j,= 3 \y / 

En consecuencia, si usamos {y < 2} como la region de rechazo, el valor de [3 cuando p = 
.10 es menor que el valor para f3 que obtuvimos en el Ejemplo 10.2 con p = .30 (.184 contra 
.873). No obstante, cuando usamos esta region de rechazo, todavfa tenemos una probabilidad 
bastante grande de decir que Jones es ganador si en verdad recibira solo 10% de los votos. 
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Los Ejemplos 10.1 al 10.3 muestran que la prueba usando RR = {y < 2} garantiza dismi- 
nuir el riesgo de cometer un error tipo I (a = .004), pero no ofrece protection adecuada contra 
un error tipo II. (Como podemos mejorar nuestra prueba? Una forma es balancear a y (3 a I 
cambiar la region de rechazo. Si agrandamos RR en una nueva region de rechazo RR* (esto 
es, RR C RR*), la prueba usando RR* nos llevara a rechazar H 0 con mas frecuencia. Si a* y a 
denotan las probabilidades de errores tipo I (niveles de las pruebas) cuando usamos RR* y RR 
como las regiones de rechazo, respectivamente, entonces, como RR C RR*, 

a* = P (estadfstico de prueba esta en RR* cuando H 0 es verdadera) 

> P (estadfstico de prueba esta en RR cuando H 0 es verdadera) = a. 

Del mismo modo, si usamos la region de rechazo agrandada RR*, el procedimiento de prueba 
nos llevara a aceptar H 0 con menos frecuencia. Si (3* y (3 denotan las probabilidades de errores 
tipo II para las pruebas que usan RR* y RR, respectivamente, entonces 

/3* = P (estadfstico de prueba no esta en RR* cuando H a es verdadera) 

< P (estadfstico de prueba no esta en RR cuando H a es verdadera) = [3. 

En consecuencia, si cambiamos la region de rechazo para aumentar a, entonces /3 disminuira. 
Del mismo modo, si el cambio en la region de rechazo resulta en una diminution en a, en¬ 
tonces (3 aumentara. Por tanto, ay (3 estan relacionadas de manera inversa. 


EJEMPLO 10.4 Consulte las prueba analizada en el Ejemplo 10.1. Ahora suponga que RR = (y < 5}. Calcule 
el nivel a de la prueba y calcule f3 si p = .3. Compare los resultados con los valores obtenidos 
en los Ejemplos 10.1 y 10.2 (donde usamos RR = {v < 2}). 

Solution En este caso, 

a = P (estadfstico de prueba esta en RR cuando H 0 es verdadera) 



Cuando p = .3, 

(3 = P (estadfstico de prueba no esta en RR cuando H a es verdadera y p = .3) 

15 /15\ 

= P(Y> 5 cuando p = .3) = ^ ^ J(.3)- v (.7) 15 " 3 ' = .278. 

Una comparacion de las a y [3 calculadas aquf con los resultados de los Ejemplos 10.1 y 
10.2 muestra que ampliar la region de rechazo de RR = {y < 2} a RR* = {y < 5 j aumenta 
a y disminuye (3 (vease la Tabla 10.1). Por tanto, hemos alcanzado un mejor balance entre 


Tabla 10.1 Comparacion de a y /3 para dos regiones de rechazo diferentes 




RR 

Probabilidades de error 

{y £2} 

{y ^5} 

a 

.004 

.151 

(3 cuando p = .3 

.873 

.278 
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los riesgos de cometer errores tipo I y tipo II, aunque a como [1 siguen siendo todavla muy 
grandes. iComo poclemos reducirlasl La respuesta es clara y logica: debemos obtener mas 
information sobre la verdadera naturaleza de la poblacion al aumentar el tamano muestral. 
Para casi todas las pruebas estadlsticas, si a esta fija en algun valor aceptablemente pequeno, 
f3 disminuye cuando el tamano muestral aumenta. ■ 


En esta section hemos definido los elementos esenciales de cualquier prueba estadlstica. 
Hemos visto que se pueden cometer dos posibles tipos de error al probar una hipotesis: los 
errores tipo I y tipo II. Las probabilidades de cometer estos errores sirven como criterios para 
evaluar un procedimiento de prueba. En las siguientes secciones usaremos las distribuciones 
muestrales que obtuvimos en el Capitulo 7 para desarrollar metodos que permitan probar hi¬ 
potesis relacionadas con parametros de frecuente interes practico. 


Ejercicios 

10.1 Defina ay (3 para una prueba estadlstica de hipotesis. 

10.2 Un investigador ha preparado un nivel de dosis de droga que segun el, inducira el sueno en 80% de las 
personas que sufren de insomnio. Despues de examinar la dosis, pensamos que lo dicho por el respecto 
a la efectividad de la dosis es exagerado. En un intento por refutar su dicho. administramos la dosis pres- 
crita a 20 personas que padecen de insomnio y observamos Y, el numero de individuos a quienes la dosis 
induce el sueno. Deseamos probar la hipotesis H 0 : p = .8 contra la alternativa, H a : p < .8. Suponga que 
se usa la region de rechazo {y £ 12}. 

a De acuerdo con la informacion de este problema, ^que es un error tipo I? 
b Encuentre a. 

c Con base en la informacion de este problema. ^que es un error tipo II? 
d Encuentre f3 cuando p = .6. 
e Encuentre /3 cuando p = .4. 

10.3 Consulte el Ejercicio 10.2. 

a Defina la region de rechazo de la forma {y £ c} de modo que a ~ .01. 
b Para la region de rechazo del inciso a, encuentre f3 cuando p = .6. 
c Para la region de rechazo del inciso a, encuentre f3 cuando p = .4. 

10.4 Suponga que deseamos probar la hipotesis nula H 0 de que la proporcion p de hojas de contabilidad con 
errores es igual a .05 contra la alternativa H a de que la proporcion es mayor que .05 usando el siguiente 
esquema. Se seleccionan al azar dos hojas de contabilidad. Si ninguna de ellas tiene errores, rechazamos 
Ho, si una o mas contienen un error, vemos una tercera hoja. Si esta no tiene errores, rechazamos H 0 . En 
todos los otros casos aceptamos H 0 . 

a De acuerdo con la informacion de este problema. ^que es un error tipo I? 
b ^Cual es el valor de a relacionado con esta prueba? 
c Con base en la informacion de este problema. ^que es un error tipo II? 
d Calcule j3 = P (error tipo II) como una funcion de p. 
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10.5 Suponga que Y t y Y 2 son independientes y estan distribuidas identicamente con una distribucion unifor¬ 
me en el intervalo (8, 8 + 1). Para probar H 0 : 8 = 0 contra H a : 8 > 0, tenemos dos pruebas: 

Prueba 1: rechazar H 0 si Y x > .95. 

Prueba 2: rechazar H 0 si Jj + Y 2 > c. 

Encuentre el valor de c para que la prueba 2 tenga el mismo valor para a que la prueba 1. [Sugerencia: 
en el Ejemplo 6.3 obtuvimos las funciones de densidad y de distribucion de la suma de dos variables 
aleatorias independientes que estan distribuidas uniformemente en el intervalo (0, 1).] 

10.6 Nos interesa probar si una moneda esta o no balanceada, con base en el numero de caras Y en 36 tiros de 
la moneda. (H 0 : p = .5 contra H a : p # .5). Si usamos la region de rechazo |y — 18| a 4, ,jcual es 

a el valor de a? 
b el valor de /3 si p = .7? 

10.7 Verdadero o falso Consulte el Ejercicio 10.6. 

a El nivel de la prueba calculado en el Ejercicio 10.6(a) es la probabilidad de que H 0 sea verdadera. 
b El valor de /3 calculado en el Ejercicio 10.6(b) es la probabilidad de que H a sea verdadera. 
c En el Ejercicio 10.6(b), /3 se calculo suponiendo que la hipotesis nula era falsa, 
d Si /3 se calculo cuando p = 0.55, el valor serfa mas grande que el valor de /3 obtenido en el Ejercicio 
10.6(b). 

e La probabilidad de que la prueba equivocadamente rechace H 0 es /3. 
f Suponga que la region de rechazo (RR) se cambio a \y — 18| a 2. 

i Esta RR llevana a rechazar la hipotesis nula con mas frecuencia que la RR empleada en el 
Ejercicio 10.6. 

ii Si a se calculo usando esta nueva RR. el valor serfa mas grande que el valor obtenido en el 
Ejercicio 10.6(a). 

iii Si /3 se calculo cuando p = .7 y usando esta nueva RR. el valor serfa mas grande que el valor 
obtenido en el Ejercicio 10.6(b). 

*10.8 Una prueba clfnica en dos etapas esta planeada para probar H 0 : p = .10 contra H a : p > .10, donde p 
es la proporcion de pacientes que responden a un tratamiento y que fueron tratados segun el protocolo. 
En la primera etapa, 15 pacientes se acumularon y trataron. Si 4 o mas de los que responden se observan 
entre los (primeros) 15 pacientes, H 0 es rechazada, el estudio se termina y no se acumulan mas pacientes. 
De otro modo, otros 15 pacientes se acumularan y trataran en la segunda etapa. Si un total de 6 o mas 
de los que responden se observan entre los 30 pacientes acumulados en las dos etapas (15 en la primera 
etapa y 15 mas en la segunda etapa), entonces H 0 es rechazada. Por ejemplo, si 5 de los que responden se 
encuentran entre los pacientes de la primera etapa, H 0 es rechazada y el estudio se termina. No obstante, 
si 2 de los que responden se encuentran entre los pacientes de la primera etapa, se acumulan 15 pacientes 
de la segunda etapa y se identifican otros 4 o mas de los que responden (para un total de 6 o mas entre 
los 30), H 0 es rechazada y el estudio termina. 1 

a Utilice la tabla binomial para hallar el valor numerico de a para este procedimiento de prueba. 
b Utilice la tabla binomial para determinar la probabilidad de rechazar la hipotesis nula cuando use esta 
region de rechazo si p = .30. 

c Para la region de rechazo definida lfneas antes, encuentre /3 si p = .30. 


1. Los ejercicios precedidos por un asterisco son opcionales. 
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10.3 


FIGURA 10.2 
Distribuciones 
muestrales del 
estimador 0 para 
varios valores de 6 


FIGURA 10.3 
Region de rechazo 
de muestra grande 
para H 0 : 9 = 9 0 
contra H a : 6 > 9 0 


Pruebas comunes con muestras grandes 

Suponga que deseamos probar un conjunto de hipotesis respecto a un parametro 9 con base 
en una muestra aleatoria Y t , Y 2 , , Y n . En esta seccion desarrollaremos procedimientos de 

prueba de hipotesis que estan basados en un estimador 9 que tiene una distribucion muestral 
normal (aproximadamente) con media 0 y error estandar Ug. Los estimadores de muestra 
grande del Capftulo 8 (Tabla 8.1), por ejemplo Y y p. satisfacen estos requisitos. Tambien 
los satisfacen los estimadores empleados para comparar dos medias poblacionales (/x, — fi 2 ) 
y para la comparacion de dos parametros binomiales {p 1 — p 2 ). 

Si 9 0 es un valor especffico de 9, podemos probar H 0 : 9 = 6 0 contra H a : 6 > 6 0 . La Figura 
10.2 contiene una grafica que ilustra las distribuciones muestrales de 6 para varios valores 
de 6. Si 0 es cercana a 9 0 , parece razonable aceptar //„. Pero, si en realidad 0 > 6 0 , es mas 
probable que 0 sea mas grande. En consecuencia, valores grandes de 9 (valores mayores a 9 0 
en una cantidad apropiada) favorecen el rechazo de H 0 : 9 = 9 0 y una aceptacion de H a : 9 > 
9 0 . Esto es, las hipotesis nula y alternativa, el estadfstico de prueba y la region de rechazo son 
como sigue: 

H 0 :9 = 9 0 . 

H a :9>9 0 . 

Estadfstico de prueba: 9. 

Region de rechazo: RR = {0 > k } para alguna seleccion de k. 

El valor real de k en la region de rechazo RR se determina al fijar la probabilidad a de error 
tipo I (el nivel de la prueba) y escoger k de conformidad (vea Figura 10.3). Si H 0 es verdadera, 
9 tiene una distribucion aproximadamente normal con media 9 0 y error estandar Ug. Por tanto, 




Rechazar H 0 
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si deseamos una prueba de nivel a, 

k = 9 o + z a cr§ 

es la seleccion apropiada para k [si Z tiene una distribution normal estandar, entonces z a es tal 
que P (Z > z a ) = a], Como 

RR = {9: 9 > 9 0 +z a cr § } = |<9 : >z a J 

si Z = (6 — do)/erg se usa como estadistico de prueba, la region de rechazo tambien se puede 
escribir como RR = {z > z a }. Observe que Z mide el numero de errores estandar entre el 
estimador para 0 y 6 0 , el valor de 9 especificado en H 0 . Por tanto, una forma equivalente de la 
prueba de hipotesis, con nivel a, es la siguiente: 

H 0 -.e = 9 0 . 

H a : 9 >9 0 . 

Estadistico de prueba: Z = -. 

Region de rechazo: [z > z a }- 

H 0 es rechazada si Z cae suficientemente alejada en la cola superior de la distribution normal 
estandar. La hipotesis alternativa H a : 0 > 9 0 se denomina alternativa de cola superior y RR 
= {z> z a } se conoce como region de rechazo de cola superior. Observe que la formula pre- 
cedente para Z es sencillamente 

estimador para el parametro- valor del parametro dado por II () 
error estandar del estimador 


EJEMPLO 10.5 El vicepresidente de ventas de una gran empresa ahrma que los vendedores estan promedian- 
do no mas de 15 contactos de venta por semana. (Le gustaria aumentar esta cantidad.) Como 
prueba de su afirmacion, aleatoriamente se seleccionan n = 36 vendedores y se registra el nu¬ 
mero de contactos hechos por cada uno para una sola semana seleccionada al azar. La media 
y varianza de las 36 mediciones fueron 17 y 9, respectivamente. ^La evidencia contradice lo 
dicho por el vicepresidente? Use una prueba con nivel a = .05. 

Solution Estamos interesados en la hipotesis de investigation de que la afirmacion del vicepresidente 
es incorrecta. Esto se puede escribir formalmente como H a : p > 15, donde p es el numero 
medio de contactos de ventas por semana. Por tanto, estamos interesados en probar 

H 0 : p = 15 contra H a .p> 15. 

Sabemos que para n lo suficientemente grande, la media muestral Y es un estimador puntual 
de p que esta distribuido normalmente en forma aproximada con py = p y try = tr/kn. 
En consecuencia, nuestro estadistico de prueba es 

z = Y - po = Y - pa 
cry cr/Jn. 

La region de rechazo, con a = .05, esta dada por {z > " 05 = 1.645} (vease Tabla 4, Apendice 
3). La varianza poblacional a 2 no se conoce, pero puede estimarse de manera muy precisa 
(porque n = 36 es lo suficientemente grande) con la varianza muestral s 2 = 9. 








498 


Capftulo 10 Prueba de hipotesis 


En consecuencia, el valor observado del estadfstico de prueba es aproximadamente 

Z = iz^ = 1 lz^ =4 _ 

s/V> ! 3/V36 

Debido a que el valor observado de Z se encuentra en la region de rechazo (porque z = 4 ex- 
cede a z 05 = 1.645), rechazamos H 0 : p = 15. Entonces, al nivel de significancia a = .05, la 
evidencia es suficiente para indicar que la afirmacion del vicepresidente es incorrecta y que el 
numero promedio de contactos de ventas por semana es mayor que 15. ■ 


EJEMPLO 10.6 Si la produccion diaria de la maquina de una fabrica tiene mas de 10% de articulos defec- 
tuosos, es necesario repararla. Una muestra aleatoria de 100 piezas de la produccion del dia 
contiene 15 piezas defectuosas y el supervisor decide que la maquina debe ser reparada. ( \La 
evidencia muestral apoya su decision? Use una prueba con nivel .01. 

Solucion Si Y denota el numero de piezas defectuosas observado, entonces Y es una variable aleatoria 
binomial, con p denotando la probabilidad de que una pieza seleccionada al azar sea defec- 
tuosa. En consecuencia, deseamos probar la hipotesis nula 

H 0 : p = .10 contra la alternativa H a : p> .10. 

El estadfstico de prueba, que esta basado en p = Y/n (el estimador puntual insesgado de p), 
esta dado por 


Z = 



P~ Po 

yjpoi 1 - Po)/n 


Podrfamos haber usado Jp( 1 — p)/n para aproximar el error estandar de p, pero como esta- 
mos considerando la distribucion de Zbajo H {) , es mas apropiado usar lp 0 ( 1 — po)/n, el valor 
verdadero del error estandar de p cuando H 0 es verdadera. 

De la Tabla 4, Apendice 3, vemos que P(Z > 2.33) = .01 por lo cual tomamos {z > 2.33} 
como la region de rechazo. El valor observado del estadfstico de prueba esta dado por 

P~ Po = -15 ~.1Q = 5 = 1 ^ 

Z Jpod-po)/n V(-l)(.9)/100 3 


Como el valor observado de Z no esta en la region de rechazo, no podemos rechazar 
H 0 : p = . 10 a favor de H a : p > .10. En terminos de su aplicacion, concluimos que, en el nivel 
de significancia de a = .01, la evidencia no apoya la decision del supervisor. 

^Esta equivocado el supervisor? No podemos hacer un juicio estadfstico acerca de esto sino 
hasta que hayamos evaluado la probabilidad de aceptar H 0 cuando H a es verdadera, es decir, hasta 
que hayamos calculado /3. El metodo para calcular /3 se presenta en la Seccion 10.4. ■ 
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La prueba d e. H 0 : 9 = 9 0 contra H a : 9 < 9 0 se hace de modo analogo, excepto que ahora 
rechazamos H 0 para valores de 9 que sean mucho menores que 9 0 . El estadrstico de prueba 
sigue siendo 


9-9 o 


pero para una a de nivel fijo rechazamos la hipotesis nula cuando z < ~z a . Debido a que 
rechazamos H 0 a favor de H a cuando z cae lo suficientemente lejos en la cola inferior de la 
distribucion normal estandar, llamamos a H a : 9 < 9 0 una cola inferior alternativa y a RR: {z 
< -z a } una region de rechazo de cola inferior. 

A1 probar H 0 : 9 = 9 0 contra H a : 9 A 9 0 . rechazamos //„ si 9 es mucho menor o mucho 
mayor que 9 0 . El estadfstico de prueba es todavra Z, como antes, pero la region de rechazo esta 
ubicada simetricamente en las dos colas de la distribucion de probabilidad para Z. Entonces, 
rechazamos sr z ' ® t z^j^. De un modo equivalente, rechazamos // M si kl > Za , 2 . 

Esta prueba se llama prueba de dos colas, en contraposicion a las pruebas de una cola emplea- 
das para las alternativas 9 < 9 0 y 9 > 9 0 . Las regiones de rechazo para la alternativa de cola 
inferior, H a : 9 < 9 0 , y la alternativa de dos lados, H a : 9 A 9 0 , se muestran en la Figura 10.4. 

A continuacion se proporciona un resumen de las pruebas de hipotesis de nivel a para 
muestras grandes desarrolladas hasta aquf. 


FIGURA 10.4 

Regiones de rechazo 
para probar 
H 0 : 6 = 6 0 contra 
(a) H a :d<6 0 y 
(b) H a : 0 # do, 
con base en 

9-9 0 



Rechazar H 0 z 


(a) 



Rechazar H 0 -z a p Za ^ Rechazar H 0 


(b) 
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Pruebas de hipotesis de nivel a para muestras grandes 

Ho: e = e 0 . 

( 6 > 8 o (alternativa de cola superior). 

0 < 0o (alternativa de cola inferior). 

0 j=. 0 q (alternativa de dos colas). 

Estadistico de prueba: Z = --. 

°8 

| {z > z a } (RR de cola superior) 

{z < -Za} (RR de cola inferior). 

{\z\ > Zaji} (RR de dos colas). 


En cualquier prueba particular, solo una de las alternativas citadas H a es apropiada. 
Cualquiera que sea la hipotesis alternativa que escojamos, debemos estar seguros de usar la 
region de rechazo correspondiente. 

( ',C6nio decidir cual hipotesis alternativa usar para una prueba? La respuesta depende de 
la hipotesis que pretendemos apoyar. Si estamos interesados solo en detectar un aumento en 
el porcentaje de piezas defectuosas (Ejemplo 10.6), debemos localizar la region de rechazo 
en la cola superior de la distribucion normal estandar. Por otra parte, si deseamos detectar un 
cambio en p ya sea arriba o debajo de p = .10, debemos localizar la region de rechazo en am- 
bas colas de la distribucion normal estandar y emplear una prueba de dos colas. El siguiente 
ejemplo ilustra una situacion en la que una prueba de dos colas es apropiada. 


EJ EMPLO 10.7 Se realizo un estudio psicologico para comparar los tiempos de reaccion de hombres y mu- 
jeres a un estimulo. En el experimento se emplearon muestras aleatorias independientes de 
50 hombres y 50 mujeres. Los resultados se muestran en la Tabla 10.2. <^Los datos presentan 
evidencia para sugerir una diferencia entre los tiempos medios de reaccion verdaderos para 
hombres y mujeres? Use a = .05. 

Solucion Con p 1 y p 2 denote los tiempos medios de reaccion verdaderos para hombres y mujeres, res- 
pectivamente. Si deseamos probar la hipotesis de que las medias difieren, debemos probar H 0 : 
(/Xj — p 2 ) = 0 contra H a : (/a, — /x 2 ) =£ 0. La alternativa de dos lados nos permite detectar ya 
sea el caso /jl 1 > p-, o el caso inverso /jl 2 > /j. ,; en cualquier caso, H 0 es falsa. 

El estimador puntual de (pL { — pL~) es (Lj — IS)- Como ya dijimos en las Secciones 8.3 y 
8.6, debido a que las muestras son independientes y ambas son grandes, este estimador sa- 
tisface las suposiciones necesarias para desarrollar una prueba de muestra grande. En conse- 


Tabla 10.2 Datos para el Ejemplo 10.7 


Hombres 

Mujeres 

ii[ = 50 

n 2 = 50 

y x =3.6 segundos 

y 2 — 3.8 segundos 

if = .18 

sf = .14 
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cuencia, si deseamos probar //„ : /x, — /jl 2 = D 0 (donde D 0 es algun valor fijo) contra cualquier 
alternativa, el estadfstico de prueba esta dado por 


Z = 


(Y i - Y 2 ) ~ D 0 


I 1 _|_ Z 


n i 


« 2 


donde crj 2 y cry son las respectivas varianzas poblacionales. En esta aplicacion deseamos usar 
una prueba de dos colas. Por tanto, para a = .05, rechazamos H 0 para |y| > z a/2 = Z 025 = 1 -96. 

Para muestras grandes (por ejemplo «,> 30), las varianzas muestrales dan buenas estima- 
ciones de sus correspondientes varianzas poblacionales. Sustituyendo estos valores, junto con 
y |, y 2 , «|, n 2 y D 0 = 0, en la formula para el estadfstico de prueba, tenemos 


Yi ~Y2 -0 



3.6 -3.8 

JW=u 

50 50 


-2.5. 


Este valor es menor que -z a / 2 = -1.96 y por tanto cae en la region de rechazo. En consecuen- 
cia, en el nivel a = .05, concluimos que existe evidencia suficiente para permitirnos afirmar 
que los tiempos medios de reaction difieren para hombres y mujeres. ■ 


En esta section, hemos descrito el procedimiento general para poner en practica pruebas 
de hipotesis con muestras grandes para algunos parametros de frecuente interes practico. En 
la Section 10.4 expondremos como calcular [3. la probabilidad de un error tipo II, para estas 
pruebas con muestras grandes. La construction de intervalos de confianza para estos parame¬ 
tros y la implantation de pruebas formales de hipotesis son sorprendentemente semejantes. 
Ambos procedimientos usan los estimadores de los parametros respectivos, los errores estan- 
dar de estos estimadores, asf como cantidades obtenidas de la tabla de la distribution normal 
estandar. En la Section 10.5 senalamos de manera explfcita una correspondencia entre proce¬ 
dimientos de prueba con muestras grandes e intervalos de confianza con muestras grandes. 


Ejercicios 

10.9 Ejercicio Applet Use la aplicacion Hypothesis Testing (for Proportions) para evaluar el impacto de 
cambiar el tamano muestral en el valor de a. Cuando se tiene acceso a la aplicacion, los valores predeter- 
minados permitiran simulaciones, cuando el verdadero valor de p = .5, de pruebas Z repetidas de nivel 
a = .05 para H 0 : p = .5 contra H a : p # .5 y n = 15. 

a ^Que action califica como un “error” en la situation que sera simulada? 

b Haga clic en el boton “Draw Sample” para obtener los resultados relacionados con una sola muestra 
de tamano 15. ^Cuantos exitos resultaron? ^Cual es el valor para pi Calcule el valor de la prueba 
estadfstica de muestra grande. ^Su calculo esta de acuerdo con el valor de z dado en la tabla bajo la 
curva normal? ^,E1 valor de z cae en la region de rechazo? ^,E1 resultado de esta simulation resulto en 
un error? 

c Haga clic en el boton “Draw Sample” cinco veces mas. ^Cuantos valores diferentes para z observo 
usted? ^Cuantos valores aparecieron en la region de rechazo dada por las colas de la curva normal? 
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d Haga clic en el boton “Draw Sample” hasta que obtenga una muestra simulada que resulte en el re- 
chazo de H 0 . ^Cual fue el valor de p que llevo al rechazo de H 0 1 ^Cuantas pruebas realizo usted hasta 
que rechazo por primera vez H 0 7 ^Por que fueron necesarias tantas simulaciones hasta que rechazo 
por primera vez la nula? 

e Haga clic en el boton “Draw 50 Samples” hasta que haya completado 200 o mas simulaciones. 
Mueva el cursor sobre la caja sombreada arriba de “Reject” en la grafica de barras de la parte inferior. 
^Que proportion de las simulaciones resulto en el rechazo de H 0 7 
f ^Por que son exactamente de la misma altura las cajas arriba de “Reject” y “Error”? 
g Use las flechas arriba y abajo a la derecha de la linea “n for sample” para cambiar el tamano muestral 
para cada simulation a 20. Haga clic en el boton “Draw 50 Samples” hasta que haya simulado al 
menos 200 pruebas. ^Que proportion de las simulaciones resulto en el rechazo de H 0 1 
h Repita las instrucciones del inciso g para muestras de tamano 30, 40 y 50. Haga clic en el boton 
“Show Summary” para ver los resultados de todas las simulaciones que realizo hasta aquf. i,Que 
observa acerca de las proporciones de veces que H 0 es rechazada usando muestras de tamano 15, 20, 
30, 40 y 50? ^Le sorprenden estos resultados? i,Por que? 

10.10 Ejercicio Applet Consulte el Ejercicio 10.9. Haga clic en el boton “Clear Summary” para borrar los 
resultados de cualesquiera simulaciones previas. Cambie el tamano muestral de cada simulation a n = 
30 y deje las hipotesis nula y altemativa en sus ajustes predeterminados H 0 : p = .5 y H a : p # .5. 

a Deje el verdadero valor de p en su ajuste predeterminado p — .5. Con esta situation, i,que es un error? 
Simule al menos 200 pruebas. i,Que proportion de las pruebas resulto en el rechazo de H 0 7 i,Que 
observa acerca de las alturas de las cajas arriba de “Reject” y “Error” en la grafica inferior derecha? 
^Por que? 

b Deje sin cambio todos los ajustes, pero cambie el verdadero valor de p a .6. Con esta modification, 
^que es un error? Simule al menos 200 pruebas. i,Que proportion de las pruebas resulto en el rechazo 
de H 0 7 i,Que observa usted acerca de las alturas de las cajas arriba de “Reject” y “Error” en la grafica 
inferior derecha? ^.Por que? 

c Deje sin cambio todos los ajustes del inciso b, pero cambie el verdadero valor dep a .7. Simule cuan- 
do menos 200 pruebas. Repita, ajustando el verdadero valor de p a .8. Haga clic en el boton “Show 
Summary”. Cuando el verdadero valor de p se aleje de .5 y se acerque a 1, i,que observa acerca de 
la proportion de simulaciones que llevan al rechazo de H 0 7 iQue esperarfa observar si se realiza un 
conjunto de simulaciones cuando el verdadero valor de p es .9? 
d ^Que esperarfa observar si se repitieran simulaciones cuando el valor real de p es .4, .3 y .21 
Intentelo. 

10.11 Ejercicio Applet En el Ejercicio 10.9(h) observo que cuando la hipotesis nula es verdadera, para todos 
los tamanos muestrales la proportion de veces en que H 0 es rechazada es aproximadamente igual a a , la 
probabilidad de un error tipo I. Si probamos H 0 : p = .5, H a .p+ .5, f,que le ocurre al valor de [3 cuando 
aumenta el tamano muestral? Fije el valor real de p en .6 y conserve el resto de los ajustes en sus valores 
predeterminados (a = .05, n = 15). 

a En la situation que sera simulada, <<cual es la unica clase de error que se puede cometer? 
b Haga clic en el boton “Clear Summary”. Realice al menos 200 simulaciones. f,Que proportion de 
las simulaciones resulto en errores tipo II (mueva el cursor sobre la caja alrededor de “Error” en la 
parte inferior derecha de la pantalla)? ^Como esta relacionada la proportion de errores tipo II con 
la proportion de veces que H 0 es rechazada? 

c Cambie n, el numero de intentos usado para cada prueba simulada, a 30 y deje todos los otros ajus¬ 
tes sin cambio. Simule al menos 200 pruebas. Repita para n = 50 y n = 100. Haga clic en el boton 
“Show Summary". jCorno cambian los valores de (3 (.6), la probabilidad de un error tipo II cuando 
p = .6, conforme aumenta el tamano muestral? 
d Deje la ventana con la information de resumen abierta y continue con el Ejercicio 10.12. 
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10.12 Ejercicio Applet Consulte el Ejercicio 10.11. Cambie a a . 1 pero conserve H 0 : p = .5, H a : p ± .5 y el 
verdadero valor de p = .6. Simule al menos 200 pruebas cuando n = 15. Repita para n = 30, 50 y 100. 
Haga clic en el boton “Show Summary”. Ahora tendra dos tablas de resumen (pudiera ser necesario 
arrastrar primero la ultima tabla de la parte superior). Compare los porcentajes de error cuando se simu- 
len pruebas usando 15, 30, 50 y 100 intentos. 

a ^Cual de las dos pruebas a = .05 o a = . 10 proporciona los valores simulados mas pequenos para j3, 
usando muestras de tamano 15? 

b ^Cual proporciona los valores simulados mas pequenos de [3 para cada uno de los otros tamanos 
muestrales? 

10.13 Ejercicio Applet Si usted repitiera las instrucciones del Ejercicio 10.10, usando n = 100 en lugar de n 
= 30, i,que esperaria que fuera similar? ^Que esperarfa que fuera diferente? 

10.14 Ejercicio Applet Consulte el Ejercicio 10.9. Inicie la aplicacion breve para probar H 0 : p = .1 contra 
H a : p < .1 al hacer clic en el boton de radio “Lower” en la linea marcada “Tail” y ajustar el valor hipo- 
tetico a .1. Fije el verdadero valor de p = .1, n = .5 y a = .20. 

a Haga clic en el boton “Draw Sample” hasta que obtenga una muestra con cero exitos. ^Cual es el 
valor de z? ^,Cual es el minimo valor posible para z? ^Es posible que obtenga una muestra de modo 
que el valor de z caiga en la region de rechazo? ^Que implica esto acerca de la probabilidad de que el 
procedimiento de prueba con “muestras grandes” rechace la hipotesis nula? ^Este resultado invalida 
el uso de pruebas con muestras grandes para una proporcion? 
b ^La prueba del inciso a rechazara la hipotesis nula verdadera aproximadamente 20% del tiempo si 
usamos n — 10? Intentelo simulando al menos 100 pruebas. ^Que proporcion de las simulaciones 
resulta en rechazo de la hipotesis nula? 

c Examine los valores de p en la tabla bajo la curva normal e identifique el valor de p para el cual la 
hipotesis nula es rechazada. Use las tablas del apendice para calcular la probabilidad de observar este 
valor cuando n = 10 y p = .1. ^Este valor es cercano a .2? 
d ^Es n = 100 suficientemente grande para que la proporcion simulada de rechazos sea cercana a .2? 
Simule al menos 100 pruebas y de su respuesta con base en la simulacion. 

10.15 Ejercicio Applet Consulte el Ejercicio 10.10. Haga clic en el boton “Clear Summary” para borrar los 
resultados de cualquiera de las simulaciones previas. Cambie el tamano muestral para cada simulacion 
a n = 30 e inicie la aplicacion breve para simular la prueba de H 0 : p = .4 contra H a .p>. 4 al nivel de 
significancia de .05. 

a Haga clic en el boton “Clear Summary” para borrar los resultados o cualquiera de las simulaciones 
previas. Ajuste el valor real de p a .4 y haga al menos 200 simulaciones. ^Cual es el porcentaje de 
pruebas simuladas que resulta en el rechazo de la hipotesis nula? ^La prueba funciona como se espe- 
raba? 

b Deje todos los ajustes como estaban en el inciso a pero cambie el valor real de p a .5. Simule al menos 
200 pruebas. Repita cuando el valor real de p es .6 y .7. Haga clic en el boton “Show Summary”. 
^Que observa acerca del porcentaje de rechazo cuando el verdadero valor de p se aleja de .4 y se acer¬ 
ca a 1? ^E1 patron que se observa se asemeja a su idea de como deberfa operar una buena prueba? 

10.16 Ejercicio Applet Consulte el Ejercicio 10.15. De nuevo, deseamos evaluar el desempeno de la prueba 
para H 0 : p = .4 contra H a : p > A al nivel de significancia de .05 usando muestras de tamano 30. 

a Si el verdadero valor de p es .3, ^aceptar la hipotesis altemativa es una decision correcta o incorrec- 
ta? 

b Haga clic en el boton “Clear Summary”. Cambie el valor real de p a .3 y simule al menos 200 prue¬ 
bas. ^Que fraction de las simulaciones resulto en la aceptacion de la hipotesis altemativa? 
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c Cambie el valor real dep a .2 y simule al menos 200 pruebas. Haga clic en el boton “Show Summary”. 

^Parece que algo esta mal? 

10.17 Un estudio publicado en la American Journal of Sports Medicine 1 reporto el numero de metros (m) por 
semana nadados por dos grupos de nadadores —los que compitieron exclusivamente en brazada de pe- 
cho y los que compitieron en el relevo individual (que incluye brazada de pecho)—. Para cada nadador, 
se registro el numero de metros por semana en la practica de brazada de pecho y el resumen de esta- 
dlsticas se proporciona a continuation. (,Hay suficiente evidencia para indicar que el numero promedio 
de metros por semana, empleados en practicar la brazada de pecho, es mayor para los especialistas en 
brazada de pecho y menor para los nadadores de relevo individual? 


Especialidad 


Exclusivamente brazada de pecho Relevo individual 


Tamano muestral 

130 

80 

Media muestral (m) 

9017 

5853 

Desviacion muestral estandar (m) 

7162 

1961 

Media poblacional 

Mi 

M-2 


a Indique las hipotesis nula y altemativa. 

b ^Cual es la region de rechazo apropiada para una prueba de nivel a = .01? 
c Calcule el valor observado del estadlstico de prueba apropiado. 
d (.Cual es su conclusion? 

e (.Cual es la razon practica para la conclusion a la que llego en el inciso d? 

10.18 Los salarios por hora en una industria particular estan distribuidos normalmente con media de $13.20 
y desviacion estandar de $2.50. Una compafua en esta industria emplea 40 trabajadores, pagandoles un 
promedio de $12.20 por hora. ^Esta compafua puede ser acusada de pagar salarios abajo del estandar? 
Use una prueba de nivel a = .01. 

10.19 El voltaje de salida para un circuito electrico es de 130. Una muestra de 40 lecturas independientes del 
voltaje para este circuito dio una media muestral de 128.6 y desviacion estandar de 2.1. Pruebe la hipo¬ 
tesis de que el promedio de voltaje de salida es 130 contra la altemativa de que es menor a 130. Use una 
prueba con nivel .05. 

10.20 El fndice Rockwell de dureza para acero se determina al presionar una punta de diamante en el acero 
y medir la profundidad de la penetration. Para 50 espedmenes de una aleacion de acero, el fndice 
Rockwell de dureza promedio 62 con desviacion estandar de 8. El fabricante dice que esta aleacion 
tiene un fndice de dureza promedio de al menos 64. (,Hay suficiente evidencia para refutar lo dicho por 
el fabricante con un nivel de significancia de 1%? 

10.21 Mediciones de resistencia al corte, obtenidas de pruebas de compresion no confinada para dos tipos de 
suelos, proporcionaron los resultados que se muestran en la siguiente tabla (medidas en toneladas por 
pie cuadrado). ^Parecen diferir los suelos con respecto al promedio de resistencia al corte con un nivel 
de significancia de 1%? 


Tipo de suelo I 

Tipo de suelo 11 

n i =30 

ns = 35 

y, = 1.65 

y 2 = 1.43 

V] = 0.26 

s 2 = 0.22 


2. Fuente: Kurt Grote, T. L. Lincoln y J. G. Gamble, “Hip Adductor Injury in Competitive Swimmers”, American 
Journal of Sports Medicine 32(1)(2004): 104. 
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10.22 En el Ejercicio 8.66 examinamos los resultados de un estudio realizado en 2001 por Leonard, Speziale 
y Pernick que compara los metodos tradicionales y los orientados a actividades para ensenar biologla. 
Se dieron resumenes de estadlsticas para las calilicaciones de preexamen de 368 estudiantes a quienes 
posteriormente se les impartio clase usando el metodo tradicional y para 372 a quienes se les impartio 
clase usando el metodo orientado a actividades. 

a Sin ver los datos, ^esperarfa usted que hubiera diferencia en las calilicaciones medias de preexamen 
para quienes posteriormente se les impartio clase usando los metodos diferentes? Con base en su 
conjetura, ^que hipotesis alternativa escogerra para probarla contra la hipotesis nula de que no hay 
diferencia en las calilicaciones medias de preexamen para los dos grupos? 
b ),La hipotesis alternativa que usted propuso en el inciso a corresponde a una prueba estadrstica de una 
cola o de dos colas? 

c La media y desviacion estandar de las calilicaciones de preexamen para quienes posteriormente 
se impartio clase usando el metodo tradicional fueron 14.06 y 5.45, respectivamente. Para quienes 
posteriormente se impartio clase usando el metodo orientado a actividades, las respectivas media y 
desviacion estandar fueron 13.38 y 5.59. ^Los datos dan apoyo a la conjetura de que las calilicaciones 
medias de preexamen no dilieren para estudiantes a quienes posteriormente se impartio clase usando 
los dos metodos? Pruebe con el uso de a = .01. 

10.23 Estudios realizados sobre los habitos de venados de cola blanca indican que estos viven y se alimentan 
en praderas muy limitadas, aproximadamente de 150 a 205 acres. Para determinar si dilieren las prade- 
ras de venados situadas en dos zonas geogralicas diferentes, los investigadores atraparon, marcaron y 
pusieron pequenos radiotransmisores a 40 venados. Varios meses despues los venados fueron rastreados 
e identilicados y se registro la distancia y desde el punto en que fueron soltados. La media y la desvia¬ 
cion estandar de las distancias desde el punto en que fueron soltados se muestran en la siguiente tabla. 3 


Ubicacion 



1 

2 

Tamano muestral 

40 

40 

Media muestral (ft) 

2980 

3205 

Desviacion muestral estandar (ft) 

1140 

963 

Media poblacional 

Mi 

M2 


a Si usted no tiene una razon preconcebida para creer que una media poblacional es mas grande que la 
otra, ^que seleccionarra para su hipotesis alternativa? para su hipotesis nula? 
b ),Su hipotesis alternativa del inciso a implicarra una prueba de una cola o de dos colas? Explique. 
c ^Sus datos brindan suliciente evidencia para indicar que las distancias medias dilieren para los dos 
lugares geogralicos? Pruebe usando a = .10. 

10.24 Un estudio hecho por el Children’s Hospital en Boston indica que alrededor de 67% de adultos estado- 
unidenses y el 15% de ninos y adolescentes tienen sobrepeso. 4 Trece ninos de una muestra aleatoria de 
100 se hallaron con sobrepeso. ) Hay suliciente evidencia para indicar que el porcentaje publicado por el 
Children’s Hospital es demasiado alto? Pruebe con un nivel de signilicancia de a = .05. 

10.25 Un artlculo en American Demographics publica que 67% de adultos estadounidenses siempre vota 
en elecciones presidenciales. 5 Para probar esta afirmacion, se tomo una muestra de 300 adultos y 192 


3. Fuente : Charles Dickey, “A Strategy for Big Bucks”, Field and Stream , octubre de 1990. 

4. Fuente : Judy Holland, “‘Cheeseburger Bill' on the Menu”, Press-Enterprise (Riverside, Calif.), 9 de marzo de 
2004, p. El. 

5. Fuente: Christopher Reynolds, “Rocking the Vote”, American Demographics, febrero de 2004, p. 48. 
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dijeron que siempre votaban en elecciones presidenciales. ^.Los resultados de esta muestra proporcionan 
suficiente evidencia para indicar que el porcentaje de adultos que dicen que siempre votan en elecciones 
presidenciales, es diferente del porcentaje publicado en American Demographies! Pruebe usando a = 

. 01 . 

10.26 Segun el Washington Post, casi 45% de todos los estadounidenses nacen con ojos cafes, aun cuando 
sus ojos no necesariamente continuan siendo cafes. 6 Una muestra aleatoria de 80 adultos encontro 32 
con ojos cafes. ^Hay suficiente evidencia en el nivel .01 para indicar que la proporcion de adultos de ojos 
cafes difiere de la proporcion de estadounidenses que nacen con ojos cafes? 

10.27 El estado de California esta trabajando muy duro para asegurar que todos los estudiantes en edad es- 
colar, cuyo lenguaje matemo no sea el ingles, tengan suficiente conocimiento de ingles cuando lleguen 
al sexto grado. Su avance es supervisado cada ano por medio de un examen de desarrollo del idioma 
ingles en California. Los resultados para dos distritos del sur de California en el ano escolar de 2003 se 
muestran en la siguiente tabla 7 . ^Estos datos indican una diferencia importante en las proporciones de 
estudiantes del ano escolar 2003 que dominan el ingles en los dos distritos? Use a = .01. 


Distrito 

Riverside 

Palm Springs 

Numero de estudiantes examinados 

6124 

5512 

Porcentaje que domina el ingles 

40 

37 


10.28 El mercantilismo del programa espacial de Estados Unidos ha sido un tema de gran interes desde que 
Dennis Tito pago $20 millones de dolares por viajar con cosmonautas rusos en un transbordador espa¬ 
cial. 8 En una encuesta hecha a 500 hombres y 500 mujeres, 20% de los hombres y 26% de las mujeres 
respondieron que el espacio deberfa permanecer libre de mercantilismo. 

a ^Existe evidencia, estadfsticamente significativa, para sugerir que hay diferencia en las proporciones 
poblacionales de hombres y mujeres que piensan que el espacio deberfa permanecer libre de mercan¬ 
tilismo? Use una prueba de nivel .05. 

b ^Por que una diferencia estadfsticamente significativa en estas proporciones poblacionales es de im- 
portancia practica para los anunciantes? 

10.29 Un fabricante de lavadoras automaticas ofrece un modelo en uno de tres colores: A, B o C. De las pri- 
meras 1000 lavadoras vendidas, 400 eran del color A. iSe concluirfa que los clientes tienen preferencia 
por el color A? Justifique su respuesta. 

10.30 Una fabricante asegura que al menos 20% del publico prefirio su producto. Se toma una muestra de 100 
personas para comprobar esta afirmacion. Con a = .05, f,que tan pequeno necesitarfa ser el porcentaje 
muestral antes de que la aseveracion pueda ser refutada legftimamente? (Observe que esto requerirfa una 
prueba de hipotesis de una cola.) 

10.31 f,Que condiciones deben satisfacerse para que la prueba Z se utilice para comprobar una hipotesis res- 
pecto a una media poblacional pP. 

10.32 En marzo de 2001, una encuesta de Gallup pregunto: “^Como clasificarfa usted la calidad general del 
medio ambiente en este pats hoy en dfa: excelente, buena, regular o mala?”. De 1060 adultos en todo 
el pals, 46% dieron una clasificacion de excelente o buena. ^Es esto una evidencia convincente de que 
una mayorfa de adultos de la nacion piensa que la calidad del medio ambiente es regular o mala? Pruebe 
usando a = .05. 


6. Fuente: “Seeing the World Through Tinted Lenses”, Washington Post, 16 de marzo de, 1993, p. 5. 

7. Fuente'. Cadonna Peyton, “Pupils Build English Skills”, Press-Enterprise (Riverside. Calif.), 19 de marzo de, 
2004, p. B-l. 

8. Fuente'. Adaptado de “Toplines: To de Moon?” American Demographics, agosto de 2001, p. 9. 
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10.33 


10.34 


10.35 


* 10.36 


10.4 


Un politologo cree que la fraction p l de republicanos es mayor que la fraction p 2 de democratas que 
estan a favor de la pena de muerte. El adquirio muestras aleatorias independientes de 200 republicanos 
y 200 democratas y encontro 46 republicanos y 34 democratas a favor de la pena de muerte. ^Esta evi- 
dencia proporciona apoyo estadistico para la creencia del investigador? Use a = .05. 

El Ejercicio 8.58 indico que una muestra aleatoria de 500 mediciones de la permanencia en hospitales 
tenia una media muestral de 5.4 dias y una desviacion estandar muestral de 3.1 dias. Un organismo 
federal de reglamentos plantea la hipotesis de que la permanencia tiene un exceso de 5 dias. ^Los datos 
apoyan esta hipotesis? Use a = .05. 

Michael Sosin 9 realizo un estudio reciente sobre los factores que explican por que la gente que tiene 
casa pero se beneficia de los programas de alimentation, pierde su hogar. La siguiente tabla contiene 
los datos obtenidos en el estudio. ^Hay suficiente evidencia para indicar que la proportion de los que 
actualmente trabajan es mayor para hombres con casa que para hombres sin casa? Use a = .01. 


Hombres sin casa Hombres con casa 

Tamano muestral 112 260 

Numero que actualmente trabaja 34 98 


Consulte el Ejercicio 8.68(b). ^Hay evidencia de una diferencia entre la proportion de residentes que 
estan a favor de la completa protection de lagartos y la proportion de quienes estan a favor de la des¬ 
truction de los mismos? Use a = .01. 


Calculo de las probabilidades del error 
tipo II y determinacion del tamano 
muestral para la prueba Z 

El calculo de (3 puede ser muy dificil para algunas pruebas estadfsticas, pero es facil hacerlo 
para las pruebas desarrolladas en la Section 10.3. En consecuencia, podemos usar la prueba 
Z para demostrar tanto el calculo de f3 como la logica empleada para seleccionar el tamano 
muestral para una prueba. 

Para la prueba H 0 : 9 = 6 0 contra H a : e>e 0 , podemos calcular probabilidades de un error 
tipo II solo para valores espetificos de 6 en H a . Suponga que el experimentador tiene en mente 
una alternativa espetifica, por ejemplo 9 = 9 a (donde o a > e 0 ). Como la region de rechazo es 
de la forma 

RR = {9: 9 > k}, 

la probabilidad [3 de un error tipo II es 

/3 = P(9 no esta en RR cuando H a es verdadera) 

( Q _ Q _ Q 

-- <-- cuando 9 = 9 a 

a 0 °e 


9. Fuente : Michael Sosin, “Homeless and Vulnerable Meal Program Users: A Comparison Study”, Social Problems 
39(2) (1992). 
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Si 9 a es el verdadero valor de 9, entonces (0 — 9 a )/cr§ tiene una distribucion normal estandar 
aproximadamente. En consecuencia, f3 puede ser determinada (en forma aproximada) al hallar 
un area correspondiente bajo una curva normal estandar. 

Para una muestra fija de tamano n, el tamano de [3 depende de la distancia entre 9 a y 9 0 . 
Si 9 a esta cerca de 9 0 , el verdadero valor de 9 (ya sea 9 0 o 9 a ) es dificil de detectar, y la pro- 
babilidad de aceptar H 0 cuando H a es verdadera tiende a ser grande. Si 9 a esta lejos de 9 0 , el 
verdadero valor es relativamente facil de detectar y /3 es mucho menor. Como vimos en la 
Seccion 10.2, para un valor especificado de a, f3 puede hacerse menor si se escoge un tamano 
muestral n grande. 


EJ E M P L O 10.8 Suponga que el vicepresidente del Ejemplo 10.5 desea detectar una diferencia igual a una 11a- 
mada en el numero medio de llamadas por semana. Es decir, desea probar //„ : /j, = 15 contra 
H a : (jl = 16. Con la information proporcionada en el Ejemplo 10.5, encuentre [3 para esta 
prueba. 


Solution En el Ejemplo 10.5 teniamos n = 36, y = 17 y s 2 = 9. La region de rechazo para una prueba 
de nivel .05 estaba dada por 


cr / Jn 


> 


1.645, 


que es equivalente a 


y — /ju 0 > 1.645 



o 


y > /i o + 1.645 



Sustituyendo ji 0 = 15 y n = 36 y usando s para aproximar cr, encontramos que la region de 
rechazo es 


y >15 + 1.645 



, o bien, lo que es equivalente, y > 15.8225. 


Esta region de rechazo se muestra en la Figura 10.5. Entonces, por definicion, (3 = P{Y < 
15.8225 cuando /r = 16) esta dada por el area sombreada bajo la curva de lmea interrumpida 
a la izquierda de k = 15.8225 en la Figura 10.5. Por tanto, para /r n = 16, 


lY ~!i a < 15.8225 - 16\ 
~ 3/^6 ) 


P(Z < - .36) = .3594 



Aceptar Hq Rechazar Hq 
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El valor grande de (3 nos dice que es frecuente que muestras de tamano n = 36 no detecten 
una diferencia de 1 unidad de las medias hipoteticas. Podemos reducir el valor de [3 si aumen- 
tamos el tamano muestral n. ■ 


El ejemplo anterior sugiere el procedimiento que un experimentador utiliza cuando escoge 
el o los tamanos muestrales para un experimento. Supongamos que usted desea probar H 0 : jj, 
= /jlq contra H a : /jl> /jl 0 . Si especifica los valores deseados de a y [3 (donde [3 se evalua cuan¬ 
do /a = i± n y \± a > il 0 ), cualquier ajuste posterior de la prueba debe comprender dos cantidades 
restantes: el tamano muestral n y el punto en el que empieza la region de rechazo, k. Como a 
y [3 se pueden escribir como probabilidades que contengan n y k, tenemos dos ecuaciones con 
dos incognitas, de las que se puede despejar n simultaneamente. Entonces, 


a 


P 


P(Y > k cuando h = Ho) 

( Y k- 

P I —;—> ——— cuando /x 


P(Y < k cuando /x = /jl ci ) 
n (Y - ll a k~ H a 


r /\M v/Jn 


cuando /j. 



P(Z > z a ). 


P(Z^-zp). 


(Vea la Figura 10.5.) 

De las ecuaciones previas para ay (3, tenemos 

k - fl o k - n a 



Despejando k de ambas ecuaciones tendremos 


Por tanto, 

(Za + Zp) 



k = Ho + Za I -p- ) = lAa-Zp(-j^). 


— /J- a ~ Ho, o bien, lo que es equivalente, Jn = 


(z a + Zp)(T 
(Ha ~ Ho) 


Tamano muestral para una prueba de cola superior de nivel a 

n _ (Za + Zp) 2 CT 2 
(Ha ~ Ho) 1 


Se obtendrfa exactamente la misma solution para una alternativa de una cola, H a : h = 
H a con H a < Ho- Se puede utilizar el metodo que acabamos de emplear para desarrollar una 
formula semejante para el tamano muestral en un problema de prueba de hipotesis de una cola 
que satisfaga las condiciones de la Section 10.3. 
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EJEMPLO 10.9 Suponga que el vicepresidente del Ejemplo 10.5 desea probar H 0 : /jl = 1 5 contra H a : /i = 16 
con a = (3 = . 05. Determine el tamano muestral que asegure esta precision. Suponga que cr 2 
es aproximadamente 9. 


Solucion Como a = [3 = .05, se deduce que z x = Zp = z 05 = 1.645. Entonces 


(Za + Z/3) 2 CT 2 
(fl a ~ /J , 0 ) 2 


(1.645 + 1.645) 2 (9) 
(16 - 15) 2 


97.4. 


En consecuencia, deben usarse n = 98 observaciones para satisfacer el requisito de que a ~ 
(3 ~ .05 para la prueba del vicepresidente. ■ 


Ejercicios 

10.37 Consulte el Ejercicio 10.19. Si el voltaje baja hasta 128 pueden aparecer consecuencias graves. Para 
probar H 0 : p = 130 contra H a : p = 128, encuentre la probabilidad de un error tipo II, /3, para la region 
de rechazo empleada en el Ejercicio 10.19. 

10.38 Consulte el Ejercicio 10.20. El acero es suficientemente duro para satisfacer los requisitos de uso si la 
dureza media Rockwell no cae por debajo de 60. Usando la region de rechazo encontrada en el Ejercicio 
10.20, encuentre (3 para la alternativa especffica p a = 60. 

10.39 Consulte el Ejercicio 10.30. Calcule el valor de [3 para la alternativa p a = .15. 

10.40 Consulte el Ejercicio 10.33. El politologo deberfa haber disenado una prueba para la cual f3 es sufi¬ 
cientemente pequena cuando p x exceda a p 2 en una cantidad significativa. Por ejemplo, determine un 
tamano muestral comun n para una prueba con a = .05 y [3 £ .20 cuando en realidad p l excede a p 2 en 
.1. [ Sugerencia : el valor maximo dep (1 — p) es .25.] 

10.41 Consulte el Ejercicio 10.34. Usando la region de rechazo ahf encontrada para calcular /3 cuando p, a = 5.5. 

10.42 En los Ejercicios 10.34 y 10.41, £que tan grande debe ser el tamano muestral si requerimos que a = .01 

y /3 =.05 cuando = 5.5? 

10.43 Una muestra aleatoria de 37 estudiantes de segundo grado que practicaban deportes obtuvieron califi- 
caciones de habilidad manual con una media de 32.19 y una desviacion estandar de 4.34. Una muestra 
independiente de 37 estudiantes del mismo grado que no los practicaban tuvo calificaciones de destreza 
manual con media de 31.68 y desviacion estandar de 4.56. 

a Aplique una prueba para ver si existe suficiente evidencia que indique que los estudiantes de segundo 
grado que practican deportes tienen una calificacion mas alta en destreza manual. Use a = .05. 
b Para la region de rechazo empleada en el inciso a, calcule [3 cuando p. x — p. 2 = 3. 

10.44 Consulte el Ejercicio 10.43. Encuentre los tamanos muestrales que dan como resultado a = .05 y (3 = 
.05 cuando — p-, = 3. (Suponga muestras de igual tamano para cada grupo.) 
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10.5 Relaciones entre los procedimientos de 
pruebas de hipotesis e intervalos 
de confianza 

Hasta este punto, hemos considerado dos procedimientos para muestras grandes que permiten 
hacer inferencias acerca de un parametro objetivo 9. En la Seccion 8.6 observamos que si 9 
es un estimador de 0 con una distribucion muestral aproximadamente normal, un intervalo de 
confianza bilateral para 9 con coeficiente de confianza 1 — a esta dado por 

9 ± Za/lOig- 

En esta expresion, cr§ es el error estandar del estimador 9 (la desviacion estandar de la distribu¬ 
cion muestral de 9) y z a / 2 es un niimcro obtenido usando la tabla normal estandar y tal que P(Z 
> z a/2 ) = a/2. Para muestras grandes, si estuvieramos interesados en una prueba de nivel a 
de H 0 : 9 = 9 0 contra la alternativa de dos lados H a : 9 =f= 9 0 , los resultados de la seccion ante¬ 
rior indican que usarfamos una prueba Z basada en el estadfstico de prueba 

0 -9 0 
Z = -- 

(T 0 

y rechazarfamos H 0 si el valor de Z cayera en la region de rechazo {|z| > z a / 2 }. Estos dos 
procedimientos hacen fuerte uso del estimador 9, su error estandar og y el valor de tabla z a / 2 - 
Exploremos estos dos procedimientos en forma mas completa. 

El complemento de la region de rechazo asociado con cualquier prueba recibe a ve- 
ces el nombre de region de aceptacion para la prueba. Para cualquiera de nuestras prue¬ 
bas con nivel a de dos colas para muestras grandes, la region de aceptacion esta dada por 
RR = j ~Z a /2 — z — Za/ 2 }. Esto es, no rechazamos H 0 : 9 = 9 0 a favor de la alternativa de 
dos colas si 

9-e 0 

—Za/2 — - — Za/2- 

Dicho de otro modo, la hipotesis nula no es rechazada (es “aceptada”) en el nivel a si 


9 - Za/io-g <0 O ^9 + Za/ 203 . 


Observe que las cantidades de la extrema izquierda y extrema derecha de la secuencia previa 
de desigualdades son los puntos extremos izquierdo y derecho, respectivamente, de un inter¬ 
valo de confianza 100(1 — a)% de dos lados para 9. Entonces, existe una dualidad entre nues- 
tros procedimientos de muestra grande para construir un intervalo de confianza 100(1 — a)% 
de dos lados y para implantar una prueba de hipotesis de dos lados con nivel a. No rechace 
H 0 : 6 = 9 0 a favor d e H a : 9 J= 9 0 si el valor 9 0 se encuentra dentro de un intervalo de con¬ 
fianza 100(1 — a)% para 9. Rechace H 0 si 9 0 se encuentra fuera del intervalo. De manera 
equivalente, un intervalo de confianza 100(1 — a)% de dos lados se puede interpretar como 
el conjunto de todos los valores de 9 0 para los cuales H 0 : 9 = 9 0 e s “aceptable” en el nivel a. 
Observe que cualquier valor dentro del intervalo de confianza es un valor aceptable del pa¬ 
rametro. No hay un valor aceptable para el parametro sino muchos (en realidad, el numero 
infinito de valores dentro del intervalo). Por esta razon, por lo general no aceptamos la hipo¬ 
tesis nula de que 9 = 9 0 , incluso si el valor 9 0 cae dentro de nuestro intervalo de confianza. 
Reconocemos que muchos valores de 9 son aceptables y nos abstenemos de aceptar un valor 
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individual de 0 como el valor verdadero. Mas comentarios respecto a la prueba de hipotesis se 
encuentran en la Section 10.7. 

Nuestra exposition anterior se concentro en la dualidad entre intervalos de confianza de dos 
lados y pruebas de hipotesis de dos lados. En los siguientes ejercicios de esta section pediremos al 
lector que demuestre la correspondencia entre pruebas de hipotesis de muestra grande, pruebas de 
hipotesis unilaterales de nivel a y la construction de los llmites apropiados superior e inferior con 
coeficientes de confianza 1 — a. Si usted desea una prueba de nivel a de H 0 : 0 = 6 0 contra H a : 6 
> 6 0 (una prueba de cola superior), debe aceptar la hipotesis altemativa si 6 0 es menor que el I unite 
de confianza inferior 100(1 — a)% para 0. Si la hipotesis altemativa apropiada es H a : 6 < 6 0 (una 
prueba de cola inferior), usted debe rechazar H 0 : 0 = d 0 a favor de H a si 6 0 es mayor que el I unite 
de confianza superior 100(1 — a)% para 0. 


Ejercicios 

10.45 Consulte el Ejercicio 10.21. Construya un intervalo de confianza de 99% para la diferencia en resistencia 
media al corte para los dos tipos de suelo. 

a ^E1 valor p- l — p, n = 0 esta dentro o fuera de este intervalo? 

b Con base en el intervalo, ^debe ser rechazada la hipotesis nula examinada en el Ejercicio 10.21? ^Por 
que? 

c ^Como se compara la conclusion a la que usted llego con su conclusion en el Ejercicio 10.21? 

10.46 Una prueba de hipotesis de nivel a y para muestras grandes en el caso de H 0 : 8 = 8 0 contra H a : 8 > 8 0 
rechaza la hipotesis nula si 


8 - e Q 

- > Z a . 




Demuestre que esto es equivalente a rechazar H 0 si 8 0 es menor que el h'mite de confianza inferior 100( 1 
— a)% de muestra grande para 8. 

10.47 Consulte el Ejercicio 10.32. Construya un llmite de confianza inferior de 95% para la proportion de 
adultos de la nation que piensan que la calidad del medio ambiente es regular o mala. 

a ^Como se compara el valor p = .50 con este llmite inferior? 

b Con base en el llmite inferior del inciso a, ^debe ser aceptada la hipotesis altemativa del Ejercicio 
10.32? 

c l,Hay algun conflicto entre la respuesta del inciso b y su respuesta al Ejercicio 10.32? 

10.48 Una prueba de hipotesis para muestras grandes y nivel a en el caso de H g : 8 = 8 0 contra H a : 8 < 8 0 
rechaza la hipotesis nula si 

8 - do „ 

- < ~Z a - 

Demuestre que esto es equivalente a rechazar H 0 si 8 0 es mayor que el llmite de confianza superior de 
muestra grande 100(1 - a)% para 8. 

10.49 Consulte el Ejercicio 10.19. Constmya un llmite de confianza superior de 95% para la lectura promedio 
de voltaje. 
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a ^Como se compara el valor p, = 130 con este li'mite superior? 

b Con base en el lfmite superior del inciso a, ^.debe aceptarse la hipotesis alternativa del Ejercicio 
10.19? 

c ^Hay algun conflicto entre la respuesta del inciso b y su respuesta al Ejercicio 10.19? 


10.6 Otra forma de presentar los resultados 
de una prueba estadfstica: niveles de 
significancia alcanzados o valores p 

Como ya indicamos previamente, es frecuente que la probabilidad a de un error tipo 1 reciba el 
nombre de nivel de significancia o bien, dicho en forma mas sencilla, nivel de la prueba. Aim 
cuando se recomienden con frecuencia pequenos valores de a, el valor real de a para usar en un 
analisis es un tanto arbitrario. Un experimentador puede escoger poner en practica una prueba con 
a = .05 mientras que otro podrfa preferir a = .01. Es posible, por tanto, que dos personas analicen 
la misma informacion y lleguen a conclusiones opuestas, una que concluya que la hipotesis nula 
debe ser rechazada en el nivel de significancia a = .05 y la otra que decida que la hipotesis 
nula debe ser rechazada con a = .01. Ademas, los valores de a de .05 o .01 a menudo se emplean 
por costumbre o por comodidad mas que como resultado de una cuidadosa consideration de 
las consecuencias de cometer un error tipo I. 

Una vez tomada una decision sobre un estadfstico de prueba ( Y en nuestro ejemplo de en- 
cuesta o una de las Z de la Section 10.3), a veces es posible presentar el valor p o el nivel de 
significancia alcanzado y que esta relacionado con una prueba. Esta cantidad es un estadfstico 
que representa el valor mas pequeno de a para el cual se puede rechazar la hipotesis nula. 


DEFINICION 10.2 Si W es un estadfstico de prueba, el valor p, o nivel de significancia alcanzado, es el 
nivel mas pequeno de significancia a para el cual la informacion observada indica que 
la hipotesis nula debe ser rechazada. 


Cuanto mas pequeno sea el valor de p, es mas fuerte la evidencia de que la hipotesis nula 
debe ser rechazada. Numerosas publicaciones cientfficas requieren que investigadores noti- 
fiquen los valores p relacionados con pruebas estadfsticas, porque le dan al lector mas infor- 
macion que la contenida en un informe de que la hipotesis nula fue o no rechazada por algun 
valor de a seleccionado por el investigador. Si el valor de p es lo suficientemente pequeno 
para convencer al lector, debe rechazar la hipotesis nula. Si un experimentador tiene un valor 
de a en mente, se puede usar el valor p para poner en practica una prueba de nivel a. El valor 
p es el mas pequeno de a para el cual la hipotesis nula puede ser rechazada. Entonces, si el 
valor deseado de a es mayor o igual al valor p, la hipotesis nula es rechazada para ese valor de 
a. En realidad, la hipotesis nula deberfa ser rechazada para cualquier valor de a por abajo 
de p incluyendo el valor de p. De otro modo, si a es menor que el valor p. la hipotesis nula 
no puede ser rechazada. En cierto sentido, el valor p permite que el lector de la investigation 
publicada evalue la magnitud de la discrepancia entre los datos observados y la hipotesis nula. 
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En particular, el valor p permite a cada lector usar su propia election para a para decidir si los 
datos observados conducen al rechazo de la hipotesis nula. 

Los procedimientos para hallar valores p para las pruebas que hemos estudiado hasta aqul, 
se presentan en los siguientes ejemplos. 


EJEMPLO 10.10 Recuerde el analisis de la encuesta polftica (vea Ejemplos 10.1 al 10.4) donde fueron mues- 
treados n = 15 votantes. Si deseamos probar H 0 : p = .5 contra H a : p < .5, usando Y = nu- 
mero de votantes a favor de Jones como nuestro estadlstico de prueba, ^cual es el valor p si 
Y = 3? Interprete el resultado. 

Solution En exposiciones previas observamos que H 0 deberla ser rechazada para valores pequenos de 
Y. En consecuencia, el valor p para esta prueba esta dado por P{Y < 3}, donde Y tiene una 
distribution binomial con n = 15 y p = .5 (el area sombreada en la distribution binomial de 
la Figura 10.6). Usando la Tabla 1 del Apendice 3, encontramos que el valor p es .018. 

Como el valor p = .018 representa el valor mas pequeno de a para el cual la hipotesis nula 
es rechazada, el experimentador que especifique cualquier valor de a > .018 serfa llevado a 
rechazar H 0 y concluir que Jones no tiene la mayorfa del voto, pero si el experimentador es- 
cogio un valor a menor que .018 la hipotesis nula no podrfa ser rechazada. 


FIGURA 10.6 
llustracion del 
valor p para el 
Ejemplo 10.10 



Este ejemplo ilustra que reportar los valores p es particularmente benefico cuando el es- 
tadfstico de prueba apropiado posee una distribution discreta. En situaciones como esta, es 
frecuente que no se pueda determinar alguna region de rechazo que de un valor a de una mag- 
nitud especificada. Por ejemplo, en este caso no se puede determinar una region de rechazo de 
la forma { v ^ a j para la cual a = .05. En tales casos, reportar el valor p suele ser preferible a 
que el experimentador se limite a valores de a que se puedan obtener con base en la distribu¬ 
tion discreta del estadlstico de prueba. 

El Ejemplo 10.10 tambien indica el metodo general para calcular valores p. Si fueramos a 
rechazar H 0 en favor de H a para valores pequenos de un estadlstico de prueba W, por ejemplo 
RR : jvr<A’},el valor p relacionado con un valor observado w 0 de W esta dado por 

valor p = P (W s >v 0 , cuando H 0 es verdadera). 


Analogamente, si fueramos a rechazar H 0 a favor de II n para valores grandes de W. por ejem¬ 
plo RR : {(rSf},el valor p relacionado con el valor observado w 0 es 

valor p = P (W > w 0 , cuando H 0 es verdadera). 


El calculo de un valor p para una alternativa de dos colas se ilustra en el siguiente ejemplo. 
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EJEMPLO 10.11 Encuentre el valor p para el estadfstico de prueba del Ejemplo 10.7. 

Solucion El Ejemplo 10.7 presenta una prueba de la hipotesis nula H 0 : /a, — p, 2 = 0 contra la hipotesis 
alternativa H a : pi l — fi^ A 0. El valor del estadfstico de prueba, calculado a partir de los datos 
observados, fue z = -2.5. Como esta prueba es de dos colas, el valor p es la probabilidad de que 
Z < —2.5 o que Z > 2.5 (las areas sombreadas en la Figura 10.7). De la Tabla 4, Apendice 3, 
encontramos que P (Z > 2.5) = P (Z < —2.5) = .0062. Como se trata de una prueba de dos 
colas, el valor p = 2(.0062) = .0124. Por tanto, si a = .05 (un valor mayor que .0124), re- 
chazamos H 0 a favor de H a y, de acuerdo con la conclusion del Ejemplo 10.7, deducimos que 
existe evidencia de una diferencia en el tiempo medio de reaccion para hombres y mujeres. 
No obstante, si se escogiera a = .01 (o cualquier valor de a < .0124) no podrfamos afirmar 
que hemos detectado una diferencia en los tiempos medios de reaccion para los dos sexos. 


FIGURA 10.7 

Las areas sombreadas 
dan el valor p para el 
Ejemplo 10.11. 



Para las pruebas estadfsticas que hemos desarrollado hasta ahora, el experimentador puede 
calcular valores p exactos con el uso de las tablas binomial y Z del Apendice 3. La aplica- 
cion Normal Probabilities tambien se puede usar para calcular valores p relacionados con las 
pruebas Z estudiadas en las Secciones 10.3 y 10.4. Las tablas (del apendice) de distribucio- 
nes para algunos de los estadfsticos de prueba que encontraremos en secciones posteriores 
proporcionan valores crfticos solo para valores especfficos de a (por ejemplo, .10, .05, .025, 
.01 y .005). En consecuencia, esas tablas no se pueden usar para calcular valores p exactos. 
No obstante, las tablas que se dan en el apendice para las distribuciones F, t y x 2 (y algunas 
otras) nos permiten determinar una region de valores dentro de las cuales se sabe que esta el 
valor p. Por ejemplo, si el resultado de una prueba es estadfsticamente significativo para a = 
.05 pero no para a = .025, indicaremos que .025 < valor p < .05. Por tanto, para cualquier 
a > .05, rechazamos la hipotesis nula; para a < .025, no rechazamos la hipotesis nula; y para 
valores de a que esten entre .025 y .05, necesitamos buscar tablas mas completas de la distri- 
bucion apropiada antes de llegar a una conclusion. Las tablas del apendice dan informacion 
litil acerca de valores p, pero los resultados son mas bien engorrosos. Los valores p exactos 
relacionados con estadfsticos de prueba con distribuciones t, x 2 y F se obtienen facilmente 
usando las aplicaciones que se presentan en el Capftulo 7. Muchas calculadoras tambien tie- 
nen capacidad de calcular valores p exactos. 

La recomendacion de que el investigador reporte el valor p para una prueba y deje la inter- 
pretacion al lector no viola los procedimientos tradicionales de pruebas estadfsticas (decision 
teorica) descritos en las secciones anteriores. El informe de un valor p simplemente deja al 
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lector decidir si rechaza la hipotesis nula (con el potencial relacionado de cometer errores tipo 
I o tipo II). Entonces, la responsabilidad de escoger a y, posiblemente, el problema de evaluar 
la probabilidad [3 de cometer un error tipo II se deja al lector. 

Ejercicios 

10.50 Los altos porcentajes de ocupacion en vuelos regulares de lfneas aereas son esenciales para tener rentabi- 
lidad. Suponga que un vuelo regular debe promediar al menos 60% de ocupacion para ser rentable y que 
un examen de los porcentajes de ocupacion para 120 vuelos de las 10:00 de la manana de Atlanta a Dallas 
mostraron un porcentaje medio de ocupacion por vuelo de 58% y desviacion estandar de 11%. Verifique 
si existe suficiente evidencia para apoyar la afirmacion de que el vuelo no es rentable. Encuentre el valor 
p relacionado con la prueba. ^Que concluirfa si desea poner en practica la prueba en el nivel a = .10? 

10.51 A dos grupos de ninos de escuela primaria se les enseno a leer con el uso de metodos diferentes, 50 por 
cada metodo. Al termino del periodo de instruction, un examen de lectura arrojo los siguientes resulta- 
dos y, = 74, y 2 = 71, si = 9 y S 2 — 10. 

a ^Cual es el nivel de significance alcanzado si se desea verificar si la evidencia indica que hay una 
diferencia entre las dos medias poblacionales? 
b ^Que se concluirfa si desea un valor de a de .05? 

10.52 Un biologo ha lanzado la hipotesis de que una alta concentracion de actinomicina D inhibe la sfntesis 
del acido ribonucleico en celulas y, por lo tanto, inhibe la production de protefnas. Un experimento 
realizado para probar esta teorfa compare la sfntesis del acido ribonucleico en celulas tratadas con dos 
concentraciones de actinomicina D: 0.6 y 0.7 microgramos por litre. Las celulas tratadas con la concen¬ 
tracion mas baja (0.6) de actinomicina D indicaron que 55 de entre 70 se desarrollaron normalmente, 
mientras que solo 23 de entre 70 parecieron desarrollarse normalmente con la concentracion mas alta 
(0.7). ^,Esta information indica que el porcentaje de sfntesis normal de acido ribonucleico es menor para 
celulas expuestas a las concentraciones mas altas de actinomicina D? 

a Encuentre el valor p para la prueba. 
b Si usted elige usar a = .05, ^cual es su conclusion? 

10.53 ^Como le gustarfa llegar a vivir 200 anos? Durante siglos la humanidad ha buscado la clave del misterio 
del envejecimiento. ^Por que envejecemos? ^E1 envejecimiento puede hacerse lento? Los estudios se 
han enfocado en los biomarcadores, es decir, cambios ffsicos o biologicos que ocurren en un tiempo 
predecible en la vida de una persona. La teorfa es que, si se encuentran formas para retardar la presencia 
de estos biomarcadores, la vida humana se puede prolongar. Un biomarcador clave, segun cientfficos, 
es la capacidad vital forzada (FVC, por sus siglas en ingles), que es el volumen de aire que una persona 
puede exhalar despues de hacer una profunda inhalation. Un estudio de 5209 hombres y mujeres de 
entre 30 y 62 anos mostro que la FVC disminuyo, en promedio, 3.8 decilitres (dl) por decada para hom¬ 
bres y 3.1 decilitres por decada para mujeres. 10 Supongamos que usted desea determinar si un programa 
de entrenamiento ffsico, para hombres y mujeres de entre 50 y 60 anos de edad, retardarfa el envejeci¬ 
miento; para hacerlo, se mide la FVC para 30 hombres y 30 mujeres que participan en el programa de 
entrenamiento a principios y fines del intervalo entre 50 a 60 anos de edad y se registra el descenso de la 
FVC para cada persona. Un resumen de los datos aparece en la siguiente tabla. 


Hombres Mujeres 


Tamano muestral 

30 

30 

Promedio de descenso muestral en FVC (dl) 

3.6 

2.7 

Desviacion muestral estandar (dl) 

1.1 

1.2 

Descenso en FVC en media poblacional 

Mi 

M2 


10. Fuente: T. Bodde, "Biomarkers of Aging: Key to a Younger Life”, Bioscience 31(8)( 1981): 566—567. 
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a ^Los datos aportan suficiente evidencia para indicar que la disminucion de la FVC, en una decada, 
para los hombres del programa de entrenamiento fisico es menor que 3.8 dl? Encuentre el nivel de 
significancia alcanzado para la prueba. 

b Consulte el inciso a. Si se escoge a = .05, ^,los datos apoyan la controversia de que la disminucion 
media en FVC es menor que 3.8 dl? 

c Realice una prueba para determinar si la disminucion en la FVC para mujeres en el programa de 
entrenamiento fisico fue menor que 3.1 dl para una decada. Encuentre el nivel de significancia alcan¬ 
zado para la prueba. 

d Consulte el inciso c. Si se escogio a = .05, ^los datos apoyan la controversia de que la disminucion 
media en FVC es menor que 3.1 dl? 

10.54 ^.Piensa usted que un porcentaje excepcionalmente alto de los ejecutivos de empresas grandes son dies- 
tros? Aun cuando 85% del publico en general es diestro. un estudio a 300 principales ejecutivos de 
grandes empresas demostro que 96% eran diestros. 

a ^La diferencia en porcentajes es estadfsticamente significativa? Pruebe usando a = .01. 
b Encuentre el valor p para la prueba y explique lo que significa. 

10.55 Un servicio de cobro de cheques bancarios descubrio que alrededor de 5% de todos los cheques envia- 
dos al servicio no tenfan fondos. Despues de instituir un sistema de verificacion de cheques para reducir 
sus perdidas, el servicio encontro que de una muestra aleatoria de 1124 que fueron cobrados en efectivo 
solo 45 cheques carecfan de fondos. ^.Existe suficiente evidencia para afirmar que el sistema de verifica¬ 
cion de cheques redujo la proporcion de cheques sin fondos? ^Que nivel de significancia alcanzado esta 
relacionado con la prueba? r,Que concluirfa usted en el nivel a — .01? 

10.56 Una companfa farmaceutica realizo un experimento para comparar los tiempos medios, en dfas, necesa- 
rios para recuperarse de los efectos y complicaciones que siguen al inicio de un resfriado comun. Este 
experimento compare personas con dosis diaria de 500 miligramos (mg) de vitamina C con los que no 
recibieron un suplemento vitammico. Para cada categorfa de tratamiento se seleccionaron aleatoriamen- 
te 35 adultos y se encontro que los tiempos medios de recuperacion y las desviaciones estandar para los 
dos grupos son los indicados en la siguiente tabla. 




Tratamiento 

Sin suplemento 500 mg de vitamina C 

Tamano muestral 

35 

35 

Media muestral 

6.9 

5.8 

Desviacion estandar muestral 

2.9 

1.2 


a ^Los datos indican que el uso de vitamina C reduce el tiempo medio requerido para la recuperacion? 

Encuentre el nivel de significancia alcanzado. 
b ^Que concluirfa la companfa en el nivel a = .05? 

10.57 El editor de una revista ha encontrado que, segun su experiencia, 60% de los suscriptores renuevan 
sus suscripciones. En una muestra aleatoria de 200 suscriptores, 108 indicaron que pensaban renovar sus 
suscripciones. ^Cual es el valor p relacionado con la prueba de que el porcentaje actual de renovaciones 
difiere del porcentaje antes experimentado? 

10.58 En un estudio para evaluar diversos efectos de usar una modelo femenina para anunciar automoviles, 
a cada uno de 100 hombres se le mostraron fotograffas de dos automoviles de mismo precio, color y 
tamano pero de diferentes marcas. A 50 de los individuos (grupo A) se les mostro el automovil 1 con 
una modelo femenina y el automovil 2 sin modelo. Ambos automoviles se les mostraron sin la modelo a 
los otros 50 individuos (grupo B). En el grupo A, el automovil 1 (mostrado con la modelo) fue calificado 
como mas costoso por 37 individuos. En el grupo B. el automovil 1 fue calificado como mas costoso 
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por 23 individuos. ^Estos resultados indiean que usar una modelo femenina aumenta el costo percibido 
de un automovil? Encuentre el valor p relacionado e indique su conclusion para una prueba de nivel 


a = .05. 


10.7 Algunos comentarios respecto 

a la teorfa de la prueba de hipotesis 

Como ya senalamos antes, podemos elegir entre poner en practica una prueba de una o de dos 
colas para una situacion determinada. Esta election esta dictada por los aspectos practicos del 
problema y depende del valor alternativo del parametro 0 que el experimentador esta tratando 
de detectar. Si sufrieramos una gran perdida financiera cuando 9 fuera mayor que 0 o pero no 
si fuera menor, concentrarfamos nuestra atencion en detectar valores de 0 mayores que En 
consecuencia, rechazariamos la cola superior de la distribution para el estadfstico de prueba 
previamente estudiado. Por otra parte, si estuvieramos igualmente interesados en detectar 
valores de 6 menores o mayores que 9 0 , emplearfamos una prueba de dos colas. 

La teorfa de pruebas estadfsticas de las hipotesis, explicada en la Seccion 10.2 y utilizada 
en la Seccion 10.3, es un procedimiento bien definido que hace posible que el investigador 
rechace o acepte la hipotesis nula con riesgo medido a o /3. Desafortunadamente, este sistema 
no es suficiente para todas las situaciones practicas. 

Para cualquier prueba estadfstica, la probabilidad a de un error tipo I depende del valor 
del parametro especificado en la hipotesis nula. Esta probabilidad puede ser calculada, al 
menos aproximadamente, para cada uno de los procedimientos de prueba estudiados en este 
texto. Para los procedimientos que hemos visto hasta aqui, la probabilidad (3 de un error tipo 
11 puede ser calculada solo despues que un valor especifico del parametro de interes haya 
sido seleccionado para considerarlo. La selection de un valor practicamente significativo para 
este parametro es, con frecuencia, dificil. Incluso si se puede identificar una alternativa sig- 
nificativa, el calculo real de f3 es a veces bastante tedioso. La especificacion de una hipotesis 
alternativa significativa es incluso mas dificil para algunos de los procedimientos de prueba 
que consideraremos en los siguientes capitulos. 

Desde luego, no deseamos pasar por alto la posibilidad de cometer un error tipo II. Mas 
adelante en este capftulo determinaremos metodos para seleccionar pruebas con el mas pe¬ 
queno valor posible de (3 para pruebas donde a, la probabilidad de un error tipo I, es un valor 
fijo seleccionado por el investigador, pero incluso en estas situaciones el mas pequeno valor 
posible de /3 puede ser bastante grande. 

Estos obstaculos no impiden el uso de pruebas estadfsticas; mas bien, nos obligan a ser cui- 
dadosos en el momento de sacar conclusiones donde hay evidencia insuficiente para permitir 
el rechazo de la hipotesis nula. Si se puede calcular un valor verdaderamente significativo para 
/3, deberfamos sentirnos justificados al aceptar H 0 si el valor de (3 es pequeno y el valor del 
estadfstico de prueba queda fuera de la region de rechazo. En una situacion mas tfpica, donde 
no hay un valor verdaderamente significativo para /3, modificaremos nuestro procedimiento 
de la siguiente manera. 

Cuando el valor del estadfstico de prueba no se encuentre en la region de rechazo, “no 
rechazar” es mejor que “aceptar” la hipotesis nula. En el ejemplo de la encuesta que vimos 
en el Ejemplo 10.1, probamos H 0 : p = .5 contra H a : p < .5. Si nuestro valor observado de Y 
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queda en la region de rechazo, rechazamos H 0 y decimos que la evidencia apoya la hipotesis 
de investigacion de que Jones perdera. En esta situacion, habremos demostrado que se apoya 
la hipotesis que nos interesa, es decir, la hipotesis de investigacion. Sin embargo, si Y no cae 
en la region de rechazo y no podemos determinar un valor especifico de p en H c que sea de 
interes directo, simplemente decimos que no rechazamos H 0 y debemos buscar information 
adicional antes de llegar a una conclusion. De manera alternativa, podriamos indicar el valor 
de p relacionado con la prueba estadistica y dejar la interpretation al lector. 

Si H 0 es rechazada por un valor “pequeno” de a (o por un valor p pequeno), este suceso 
no implica que la hipotesis nula sea “erronea en una cantidad grande”. Si significa que la hi¬ 
potesis nula puede ser rechazada con base en un procedimiento que incorrectamente rechaza 
la hipotesis nula (cuando H 0 es verdadera) con una pequena probabilidad (esto es, con una 
pequena probabilidad de un error tipo I). Tambien debemos abstenernos de igualar la signi- 
ficancia estadistica con la prdctica. Si consideramos el experimento descrito y analizado en 
los Ejemplos 10.7 y 10.11, el valor p de .0124 es “pequeno”, y el resultado es estadistica- 
mente significativo para cualquier seleccion de a > .0124. No obstante, la diferencia entre 
los tiempos medios de reaction para las dos muestras es de solo .2 segundo, un resultado que 
puede o no ser prdcticamente significativo. Para evaluar la significance practica de esa dife¬ 
rencia, es posible formar un intervalo de confianza para /j., — /x 2 con el uso de los metodos 
de la Section 8.6. 

Finalmente, son oportunos algunos comentarios respecto a la seleccion de las hipotesis 
nulas que hemos empleado, en particular en las pruebas de una cola. Asi, en el Ejemplo 
10.1 identificamos la hipotesis alternativa apropiada como H a : p < .5 y empleamos H 0 : 
p = .5 como nuestra hipotesis nula. El estadfstico de prueba fue Y = numero de votantes 
que estaban a favor de Jones en una muestra de tamano n = 15. Una region de rechazo que 
consideramos era {y < 2). Usted podrfa preguntarse por que no usamos // ( j : p > .5 como la 
hipotesis nula. Esto tiene sentido porque todo posible valor de p esta ya sea en Hq : p > .5 
o en H a : p < 0.5. 

Entonces, ^por que usamos H 0 : p = .5? Sencillamente porque lo que en realidad nos im- 
porta es la hipotesis alternativa H a : p < .5; la hipotesis nula no es nuestro principal interes. 
Como ya dijimos, por lo general no aceptamos en realidad la hipotesis nula de cualquier 
modo, cualquiera que sea su forma. Ademas, H 0 : p = .5 es mas facil de manejar y lleva a 
exactamente las mismas conclusiones con el mismo valor de a sin requerir que desarrollemos 
teorfa adicional para manejar un /7 ( j: p > .5. mas complicado. Cuando usamos H 0 : p = .5 
como hipotesis nula, calcular el nivel a de la prueba fue relativamente sencillo: solo hallamos 
P (Y < 2 cuando p = .5). Si hubieramos usado // ( j : p 2= .5 como la hipotesis nula, nuestra 
definicion previa de a hubiera sido inadecuada porque el valor de P (Y < 2) es en realidad una 
funcion de p para p > .5. En casos como estos, a se define como el mdlximo (sobre todos 
los valores de p > .5) valor de P (Y < 2). Aun cuando no deduzcamos este resultado aqui, 
max ;; : .. 5 P (Y < 2) ocurre cuando p = .5, el valor “frontera” de p en : p > .5. Entonces, 
obtenemos el valor “correcto” de a si usamos la hipotesis nula mas sencilla H 0 : p = .5. 

Enunciados similares son verdaderos para todas las pruebas que hemos considerado hasta 
aqui y que tomaremos en cuenta para futuras explicaciones. Esto es, si consideramos que H a \ 
0 > 6 0 es la hipotesis de investigacion adecuada, a = ma Xg^g 0 P (estadfstico de prueba en 
RR) se presenta cuando 0 = 6 0 , el valor “frontera” de 6. Del mismo modo, si H a : 6 < 6 0 es la 
hipotesis de investigacion adecuada, a = mAxg>g 0 /-’(estadfstico de prueba en RR) se presenta 
cuando 0 = 6 0 . Por tanto, el uso d e H 0 : 6 = 6 0 en lugar de H 0 :6 & 6q lleva al procedimiento 
de prueba correcto y el calculo correcto de a sin hacer mas consideraciones innecesarias. 
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Ejercicios 

10.59 Ejercicio Applet Use la aplicacion Hypothesis Testing (for Proportions) (consulte Ejercicios 10.9- 
10.16) para completar lo siguiente. Inicie la aplicacion breve para simular los resultados de pruebas de 
H 0 : p = . 8 contra H a :p> .8, usando a = .2 y muestras de tamano n = 30. Haga clic en el boton “Clear 
Summary" para borrar los resultados de cualesquiera simulaciones previas. 

a Fije el verdadero valor de p en .8 y realice al menos 200 pruebas simuladas. ^Que proporcion de 
simulaciones resulta en el rechazo de la hipotesis nula? 
b Deje todos los ajustes en sus valores previos, excepto que ahora cambie al verdadero valor de p a .75. 
Efectue al menos 200 pruebas simuladas y observe la proporcion de las simulaciones que llevaron al 
rechazo de la hipotesis nula. Repita, fijando el verdadero valor de p en .7 y de nuevo con el verdadero 
valor de p = .65. 

c ^Que espera que ocurra si la simulacion se repite despues de fijar el verdadero valor de p en cualquier 
valor menor que .65? Intentelo. 

d Haga clic en el boton “Show Summary”. ^Cual de las p verdaderas empleadas en las simulaciones 
resulto en la maxima proporcion de prueba simulada que rechazo la nula y acepto la alternativa, H a 
: p > .8? ^,Esto confirma cualquier afirmacion hecha en el ultimo parrafo de la Seccion 10.7? ^.Cual 
afirmacion? 

10.60 Ejercicio Applet Consulte el Ejercicio 10.59. Inicie la aplicacion breve para simular los resultados de 
pruebas de H 0 : p = .4 contra H a : p < .4, usando a = .2 y muestras de tamano n = 30. Haga clic en el 
boton “Clear Summary” para borrar los resultados de cualesquiera simulaciones previas. 

a Fije el verdadero valor de p en .4 y realice al menos 200 pruebas simuladas. ^Que proporcion de las 
simulaciones resulta en el rechazo de la hipotesis nula? 
b Deje todos los ajustes en sus valores previos, excepto que ahora cambie el verdadero valor de p a .45. 
Haga al menos 200 pruebas simuladas y observe la proporcion de las simulaciones que llevaron al 
rechazo de la hipotesis nula. Repita, fijando el verdadero valor de p en .5, luego en .55. 
c ^Que espera que ocurra si la simulacion se repite despues de fijar el verdadero valor de p en cualquier 
valor mayor que .55? Intentelo. 

d Haga clic en el boton “Show Summary”. ^Cual de las p verdaderas empleadas en las simulaciones 
resulto en la maxima proporcion de pruebas simuladas que rechazaron la nula y aceptaron la alterna¬ 
tiva, H a .p < .4? <^Esto confirma cualesquiera afirmaciones hechas en el ultimo parrafo de la Seccion 
10.7? ^.Cuales de ellas? 


10.8 Prueba de hipotesis con muestras 
pequenas para /jl y ^ — \x 2 

En la Seccion 10.3 explicamos los procedimientos de prueba de hipotesis que, al igual que 
los metodos de estimation de intervalo desarrollados en la Seccion 8.6, son utiles para mues¬ 
tras grandes. Para que estos procedimientos sean aplicables, el tamano muestral debe ser lo 
suficientemente grande para que Z = (f) ~ 0o)/crg tenga aproximadamente una distribucion 
normal estandar. La Seccion 8.8 contiene procedimientos basados en la distribucion t para 
construir intervalos de confianza para fi (la media de una sola poblacion normal) y /i , — p 2 (la 
diferencia en las medias de dos poblaciones normales con varianzas iguales). En esta seccion 
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desarrollaremos procedimientos formales para probar hipotesis acerca de /x y /jl 1 — /x 2 . que 
son adecuados para muestras pequenas a partir de poblaciones normales. 

Supongamos que Tj, Y 2 ,..., Y n denotan una muestra aleatoria de tamano n de una distribu¬ 
tion normal con media /x desconocida y varianza a 2 desconocida. Si Y y S denotan la media 
muestral y la desviacion muestral estandar, respectivamente, y si H f) : /x = p 0 es verdadera, 
entonces 

T = Y-(l q 

S/ JE 

tiene una distribucion t con n — 1 grados de libertad (vea la Seccion 8 . 8 ). 

Como la distribucion t es simetrica y en forma de campana, la region de rechazo para una 
prueba de la hipotesis H 0 : /x = /x 0 con muestras pequenas debe estar localizada en las colas 
de la distribucion t y ser determinada de forma semejante a la empleada con el estadfstico 
Z de una muestra grande. Por analogfa con la prueba Z desarrollada en la Seccion 10.3, la 
region de rechazo adecuada para la alternativa de cola superior H a : /x > /x 0 esta dada por 

RR = {t > t a }, 

donde t a es tal que P{T > t a } = a para una distribucion t con n — 1 grados de libertad (vease 
la Tabla 5, Apendice 3). 

Un resumen de las pruebas para /i con base en la distribucion t, conocidas como pruebas 
t, es el siguiente. 


Prueba de muestra pequena para /x 

Suposiciones: Y t , V 2 , , Y n constituyen una muestra aleatoria de una distribucion 

normal con E ( Y-) = /x. 

H 0 :/x = /x 0 . 

/x > /xo (alternativa de cola superior). 

H„ : /x < /x 0 (alternativa de cola inferior). 

/x ^ /xo (alternativa de dos colas). 

Y-n o 


Estadfstico de prueba: T = 


Region de rechazo: 


t > t a 
t < ~t a 
\t\ > t a /2 


(RR de cola superior). 
(RR de cola inferior). 
(RR de dos colas). 


(Vea la Tabla 5, Apendice 3, para valores de t a , con v = n — 1 grados de libertad.) 


EJ E M P L O 10.12 El ejemplo 8.11 proporciona las velocidades iniciales de ocho balas probadas con una nueva 
polvora, junto con la media muestral y la desviacion muestral estandar, y = 2959 y s = 39.1. 
El fabricante dice que la nueva polvora produce un promedio de velocidad de no menos de 
3000 pies por segundo. ^Los datos muestrales aportan suficiente evidencia para contradecir lo 
afirmado por el fabricante en el nivel de signibcancia de .025? 
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Solucion Suponiendo que las velocidades iniciales estan distribuidas normalmente en forma aproxi- 
mada, podemos usar la prueba que acabamos de mencionar. Deseamos probar H 0 : /jl = 3000 
contra la alternativa, H a : /jl < 3000. La region de rechazo esta dada por t < — f 025 = —2.365, 
donde t posee v = n — 1=7 grados de libertad. A1 hacer el calculo encontramos que el valor 
observado del estadfstico de prueba es 

v - llo 2959 - 3000 

t = -—^ = -— = -2.966. 

s/Vn 39.1/V8 

Este valor cae en la region de rechazo (esto es, t = —2.966 es menor que —2.365); por tanto, 
la hipotesis nula es rechazada en el nivel de significancia a = .025. Concluimos que existe su- 
ficiente evidencia para contradecir lo afirmado por el fabricante y que la verdadera velocidad 
media es menor que 3000 ft por segundo en el nivel de significancia de .025. ■ 


EJEMPLO 10.13 /Cual es el valor p relacionado con el estadfstico de prueba del Ejemplo 10.12? 

Solucion Como la hipotesis nula debe ser rechazada si t es “pequena”, el valor mfnimo de a para el 
cual la hipotesis nula puede ser rechazada es elvalor p = P (T < —2.966), donde T tiene una 
distribucion t con n — 1 = 7 grados de libertad. 

A diferencia de la tabla de areas bajo la curva normal (Tabla 4, Apendice 3), la Tabla 5 
del Apendice 3 no indica areas correspondientes a muchos valores de t. En lugar de ello, 
proporciona los valores de t correspondientes a areas de cola superior iguales a .10, .05, .025, 
.010 y .005. En vista de que la distribucion t es simetrica alrededor de 0, podemos usar estas 
areas de cola superior para dar las correspondientes areas de cola inferior. En este caso, el 
estadfstico t esta basado en 7 grados de libertad; por tanto, consultamos la fila de grados de 
libertad (gl)= 7 de la Tabla 5 y encontramos que —2.966 cae entre -t 025 = —2.365 y -f 01 = 
—2.998. Estos valores estan indicados en la Figura 10.8. Como el valor observado de T (—2.966) 
es menor que -f 025 = —2.376 pero no menor que -t m = —2.998, rechazamos H 0 para a = .025 
pero no para a = .01. Entonces, el valor p para la prueba satisface a .0 1 < valor p < .025. 

El valor exacto de p se obtiene facilmente usando la aplicacion Student’s t Probabilities 
and Quantiles (disponible en www.thomsonedu.com/statistics/wackerly). Usando la aplica¬ 
cion con 7 grados de libertad, obtenemos un valor p = P (T < —2.966) = P (T> 2.966) = 
.01046, un valor que ciertamente esta entre .01 y .025. Entonces, los datos indican que lo 
dicho por el fabricante debe ser rechazado para cualquier seleccion de a > .01046. 


FIGURA 10.8 
Limitacion del valor 
p para el Ejemplo 
10.13 usando la 
Tabla 4, Apendice 3 

.01 f-2-996- 
-2.998 

.025 -2.365 ■ 
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Una segunda aplicacion de la distribucion t es en la construction de una prueba para mues- 
tra pequena que compara las medias de dos poblaciones normales que poseen varianzas igua- 
les. Suponga que se seleccionan muestras aleatorias independientes de cada una de dos pobla¬ 
ciones normales: Y n , Y n , . . . , Y, de la primera y K 2 i , Yu, . .., E i „ 2 de la segunda, donde la 
media y la varianza de la f-esima poblacion son /j, ( y cr 2 , para i = 1,2. Ademas, suponga que 
Yj y Sj. para i = 1, 2, son las correspondientes medias muestrales y varianzas. Cuando estas 
suposiciones se cumplen, en la Seccion 8.8 se demuestra que si 

^ = (n x - l)5f + (»2 ~ 1)^2 
p n\ + ri2 ~ 2 


es el estimador agrupado para cr 2 , entonces 


tiene una distribucion 
hipotesis nula H 0 : i± l 
entonces 


T = 


<7i -y 2 )- 0 ii - M 2 ) 


T = 



1 1 

1 

Sp, 

/ — + 

— 


V »1 

«2 

- n 2 

— 2 grados 

n valor fijo 

D 0> 

Li 

-y 2 - 

D 0 


1 1 

1 

Sp, 

[— + 

— 


V »i 

n 2 


tiene una distribucion t de Student con n x + n 2 — 2 grados de libertad. Observe que este es- 
tadfstico de prueba para muestras pequenas es parecido a su similar para muestras grandes, 
el estadfstico Z de la Seccion 10.3. Las pruebas de la hipotesis H 0 : /jl x — /jl 2 = D 0 contra 
alternativas de cola superior, cola inferior y de dos colas son conducidas en la misma forma 
que en la prueba de muestras grandes, excepto que empleamos el estadfstico t y tablas de la 
distribucion t para llegar a nuestras conclusiones. Veamos a continuacion un resumen de los 
procedimientos de prueba para muestras pequenas en el caso de j± ] — \± 2 , 


Pruebas con muestras pequenas para comparar dos medias poblacionales 

Suposiciones: muestras independientes de distribuciones normales con cr 2 = cry. 


Wo: Mi — M2 — A). 
Mi — M2 > 


Ha : 


Mi — M2 < A 
Mi — M2 7^ A 


Estadfstico de prueba: 


T 


(alternativa de cola superior), 
(alternativa de cola inferior), 
(alternativa de dos colas). 


Y, -Y 2 - D 0 



, donde S p = 


(«, ~ 1)S 2 + (« 2 - 1)S 2 2 



2 


Region de rechazo: 


t>t a 
t < -ta 

_ M > t a /2 


(RR de cola superior). 
(RR de cola inferior). 
(RR de dos colas). 


Aquf, P (T > t n ) = a y grados de libertad v = n x + n 2 — 2. (Vea la Tabla 5, 
Apendice 3.) 
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EJ EM PLO 10.14 El Ejemplo 8.12 indica el tiempo requerido para completar un procedimiento de ensamble 
usando dos metodos diferentes de capacitacion. Los datos muestrales son los que aparecen en 
la Tabla 10.3. ^Hay suficiente evidencia para indicar una diferencia en los verdaderos tiempos 
medios de ensamble para quienes se capacitan usando los dos metodos? Pruebe al nivel a = 
.05 de significancia. 


Tabla 10.3 Datos para el Ejemplo 10.14 


Procedimiento estandar 

Nuevo procedimiento 

/ii = 9 

n 2 = 9 

y { = 35.22 segundos 

y 2 — 31.56 segundos 

Z/=i(>’ii - JO 2 = 195.56 

E?-i(ya -y 2 ) 2 = 160.22 


Solucion 


Probaremos H 0 : (/i l — fi 2 ) — 0 contra la alternativa H a : (/jl^ — /jl 2 ) # 0. Por consiguiente, 
debemos usar una prueba de dos colas. El estadistico de prueba es 


(Et -Y 2 )~Do 


rr 

1 

s P J— 

+ — 

V «1 

«2 


con D 0 = 0, y la region de rechazo para a = .05 es |t| > t a , 2 = t 025 . En este caso, t 025 = 2.120 
porque t esta basada en (n { + n 2 — 2) = 9 + 9 — 2 = 16 grados de libertad. 

El valor observado del estadistico de prueba se encuentra al calcular primero 


s p 



195.56 + 160.22 
9 + 9-2 


722.24 =4.716. 


Entonces, 


E, -E2 35.22 -31.56 , ^ 

t = - , = - , = 1.65. 

n r n r 

s„ — + — 4.716./- + - 

/ V «i «2 V 9 9 

Este valor no cae en la region de rechazo (|f| > 2.120); en consecuencia, la hipotesis nula no 
es rechazada. No hay suficiente evidencia para indicar una diferencia en los tiempos medios 
de ensamble para los dos periodos de capacitacion en el nivel de significancia a = .05. 

Observe que, de acuerdo con los comentarios de la Seccion 10.7, no hemos aceptado H 0 : 
/i l — /i 2 = 0 sino que, mas bien, hemos expresado que no tenemos suficiente evidencia para 
rechazar H 0 y aceptar la alternativa H a : /a, — /x 2 + 0. ■ 


EJEMPLO 10.15 Encuentre el valor p para la prueba estadistica del Ejemplo 10.14. 

Solucion El valor observado del estadistico de prueba para esta prueba de dos colas fue t = 1.65. El 
valor p para esta prueba es entonces la probabilidad de que T> 1.65 o T < —1.65, las areas 
sombreadas en la Figura 10.9, es decir, A , + A 2 . 

Como este estadistico de prueba esta basado en n { + n 2 — 2 = 16 grados de libertad, consul- 
tamos la Tabla 5, Apendice 3, para hallarf 05 = 1.746y f 10 = 1.337. Por tanto. A, = P(T> 1.65) 
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FIGURA 10.9 

Las areas sombreadas 
son el valor 
de p para el 
Ejemplo 10.1 5 



se encuentra entre .05 y .10; esto es, .05 < A { < .1. Del mismo modo, .05 < A 2 < .1. Como 
el valor p = A x + A 2 , se deduce que .1 < valor p < .2. 

La aplicacion Student’s 1 Probabilities and Quantiles dice que, con 16 grados de libertad, 
A { = P (T > 1.65) = .0592 = A 2 y que el valor exacto de p es = .1184. Asf, el valor mfnirno 
de a para el cual los datos indican una diferencia en los tiempos medios de ensamble para los 
capacitados usando los dos metodos es .1184. 

Ya sea que el valor de p se determine exactamente usando la aplicacion o se limite usando 
la Tabla 5, Apendice 3, si seleccionamos a = .05, no podemos rechazar la hipotesis nula. Esta 
es la misma conclusion a la que llegamos en el Ejemplo 10.14, donde formalmente pusimos 
en practica la prueba de nivel de .05. ■ 


La prueba del Ejemplo 10.12 esta basada en la suposicion de que las mediciones de las 
velocidades iniciales han sido seleccionadas al azar de una poblacion normal. En la mayorfa 
de los casos es imposible verificar esta suposicion. Podrfamos preguntarnos como afecta este 
predicamento a la validez de nuestras conclusiones. 

Estudios empfricos del estadfstico de prueba 

Y~ P- 

S/ ^In 

han sido realizados por muestreo de numerosas poblaciones con distribuciones no normales. 
Estas investigaciones han demostrado que las desviaciones moderadas de la normalidad en la 
distribucion de la poblacion tienen poco efecto en la distribucion de probabilidad del estadfs¬ 
tico de prueba. Este resultado, junto con la existencia comun de distribuciones casi normales 
de datos en la naturaleza, hace que la prueba t de una media poblacional sea sumamente util. 
Las pruebas estadfsticas que no tienen sensibilidad a desviaciones a partir de las suposiciones 
en las que estan basadas poseen una gran aplicabilidad. Debido a su insensibilidad a las viola- 
ciones de los supuestos formales, reciben el nombre de pruebas estadisticas robustas. 

Al igual que la prueba t para una sola media, la prueba t para comparar dos medias pobla- 
cionales (a veces llamada prueba 1 de dos muestras ) es robusta con respecto a la suposicion 
de normalidad. Tambien es robusta con respecto a la suposicion de que oy = cry cuando n 1 y 
n 2 son iguales (o casi iguales). 

Por ultimo, la dualidad entre pruebas e intervalos de confianza que consideramos en la 
Seccion 10.6 se cumple para las pruebas basadas en las distribuciones t que consideramos en 
esta seccion y los intervalos de confianza presentados en la Seccion 8.8. 
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Ejercicios 

10.61 ^Por que la prueba Z suele ser inapropiada como procedimiento de prueba cuando el tamano muestral es 
pequeiio? 

10.62 ^Que suposiciones se hacen cuando una prueba t de Student se emplea para probar una hipotesis que 
comprende una media poblacional? 

10.63 Un proceso quimico ha producido, en promedio, 800 toneladas de un quhnico al dla. La production 
diaria para la semana pasada fue 785, 805, 790, 793 y 802 toneladas. 

a ^Estos datos indican que el promedio de production es menos de 800 toneladas y, por tanto, que algo 
esta mal en el proceso? Pruebe al nivel de significancia de 5%. ,',Que suposiciones deben cumplirse 
para que sea valido el procedimiento empleado por usted para analizar estos datos? 
b Use la Tabla 5, Apendice 3, para asignar llmites para el valor p respectivo. 

c Ejercicio Applet Use la aplicacion Student’s t Probabilities and Quantiles para hallar el valor p 
exacto. ^E1 valor p exacto satisface los llmites que obtuvo en el inciso b? 
d Use el valor p del inciso c para decidir, en el nivel de significancia de 5%, si hay algo mal en el pro¬ 
ceso. ^La conclusion de usted concuerda con aquella a la que llego en el inciso a? 

10.64 Una maquina expendedora de gaseosas fue disenada para descargar en promedio 7 onzas de llquido por 
taza. En una prueba de la maquina, diez tazas de llquido se sacaron de la maquina y se midieron. La 
media y la desviacion estandar de las diez mediciones fueron 7.1 onzas y .12 onzas, respectivamente. 
^Estos datos presentan suficiente evidencia para indicar que la descarga media difiere de 7 onzas? 

a ^Que se puede decir acerca del nivel de significancia alcanzado para esta prueba con base en la tabla 
t del apendice? 

b Ejercicio Applet Encuentre el valor exacto de p usando la aplicacion Student’s t Probabilities and 
Quantiles. 

c ^.Cual es la decision adecuada si a = .10? 

10.65 Los operadores de vehlculos a gasolina se quejan del precio de esta en las gasolineras. Segun el American 
Petroleum Institute, el impuesto federal a la gasolina por cada galon es constante (18.40 al 13 de enero 
de 2005), pero los impuestos estatales y locales varlan de 7.50 a 32.100 para n = 18 areas metropolita- 
nas clave en todo el pals. 11 El impuesto total por galon de gasolina en cada uno de estos lugares se da a 
continuation. Suponga que estas mediciones constituyen una muestra aleatoria de tamano 18: 

42.89 53.91 48.55 47.90 47.73 46.61 

40.45 39.65 38.65 37.95 36.80 35.95 

35.09 35.04 34.95 33.45 28.99 27.45 

a (.Hay suficiente evidencia para decir que el promedio de impuesto por galon de gasolina es menor que 
450? Use la tabla t del apendice para limitar el valor p relacionado con la prueba. 
b Ejercicio Applet ^Cual es el valor p exacto? 

c Construya un intervalo de confianza de 95% para el promedio de impuesto por galon de gasolina en 
Estados Unidos. 

10.66 Los investigadores han demostrado que fumar cigarrillos dene un efecto nocivo en la funcion de los pul- 
mones. En su estudio del efecto de fumar sobre la capacidad de los pulmones para difundir el monoxido 
de carbono (DL, por sus siglas en ingles) Ronald Knudson, W. Kaltenbom y B. Burrows encontraron que 


11. Fuente: “Gasoline Tax Rates by State”, http: // www.gaspricewatch.com / usgastaxes.asp, 13 de enero de 2005. 
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los fumadores actuates tuvieron lecturas de DL considerablemente mas bajas que ex fumadores o que 
quienes no fuman. 12 La capacidad de difusion de monoxido de carbono para una muestra aleatoria de 
fumadores actuates fue como sigue: 


103.768 

88.602 

73.003 

123.086 

91.052 

92.295 

61.675 

90.677 

84.023 

76.014 

100.615 

88.017 

71.210 

82.115 

89.222 

102.754 

108.579 

73.154 

106.755 

90.479 


^Estos datos indican que la lectura media de DL para fumadores actuates es menor que 100, el promedio 
de lectura de DL para los no fumadores? 

a Pruebe al nivel a = .01. 

b De limites al valor p usando una tabla del apendice. 
c Ejercicio Applet Encuentre el valor p exacto. 

10.67 La informacion nutrimental dada por Kentucky Fried Chicken (KFC) dice que cada bolsa pequena de 
papas contiene 4.8 onzas de alimento y 280 catenas. Una muestra de diez pedidos de restaurantes KFC 
en New York y New Jersey promedio 358 catenas. 13 

a Si la desviacion estandar muestral fue s = 54, ^hay suficiente evidencia para indicar que el numero 
promedio de catenas en bolsas pequenas de papas de KFC es mayor que el anunciado? Pruebe al 
nivel de significancia de 1%. 

b Construya un limite inferior de confianza de 99% para el verdadero numero medio de catenas en 
bolsas pequenas de papas de KFC. 

c Con base en el limite obtenido en el inciso b, ^que concluiria acerca de la afirmacion de que el nume¬ 
ro medio de catenas es mayor que 280? (,C6mo se compara esta conclusion con la del inciso a en la 
que se realizo una prueba formal de hipotesis? 

10.68 i,Que supuestos se establecen acerca de las poblaciones de las que se obtienen muestras aleatorias inde- 
pendientes, cuando se usa la distribucion t para hacer inferencias de muestras pequenas respecto a las 
diferencias en medias poblacionales? 

10.69 Dos metodos para ensenanza de lectura se aplicaron a dos grupos de ninos de escuela primaria seleccio- 
nados al azar y luego se compararon con base en un examen de comprension de lectura aplicado al fi¬ 
nal del periodo de ensenanza. Las medias muestrales y las varianzas calculadas a partir de las califica- 
ciones del examen se muestran en la tabla siguiente. 



Metodo I 

Metodo II 

Numero de ninos por grupo 

11 

14 

y 

64 

69 

s 2 

52 

71 


iLos datos presentan suficiente evidencia para indicar una diferencia en las calificaciones medias, para 
las poblaciones relacionadas con los dos metodos de ensenanza? 

a i,Que se puede decir acerca del nivel de significancia alcanzado usando la tabla apropiada del apen¬ 
dice? 


12. Fuente : Ronald Knudson, W. Kaltenborn, and B. Burrows, “The Effects of Cigarette Smoking and Smoking 
Cessation on the Carbon Monoxide Diffussing Capacity of the Lung in Asymptomatic Subjects”, American Review 
of Respiratory Diseases 140 (1989) 645—651. 

13. Fuente'. “KFC: Too Finger-Lickin' Good?”, Good Housekeeping Saavy Consumer Product Tests, http://maga¬ 
zines. ivillage.com/goodhousekeeping/print/O,,44604L00.html, 11 de marzo de 2004. 
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b Ejercicio Applet ^Que se puede decir acerca del nivel de significancia alcanzado, usando la aplica- 
cion apropiada? 

c ^Que suposiciones se requieren? 

d ^Que concluiria usted en el nivel de significancia a — .05? 

10.70 La Florida Game and Fish Commission realizo un estudio para evaluar las cantidades de residuos quf- 
micos hallados en el tejido cerebral del pelfcano cafe. En una prueba de DDT, muestras aleatorias de 
= 10 pelfcanos jovenes y n 2 = 13 polluelos produjeron los resultados que se muestran en la siguiente 
tabla (mediciones se expresan en partes por millon, ppm). 


Jovenes 

Polluelos 

n | = 10 

n 2 = 13 

Vi = -041 

y 2 = .026 

si = .017 

s 2 = .006 


a Pruebe la hipotesis de que cantidades medias de DDT, halladas en pelfcanos jovenes y polluelos, no 
difieren frente a la altemativa de que los pelfcanos jovenes tienen una media mas grande. Use a = 
.05 (Esta prueba tiene importantes implicaciones respecto a la acumulacion de DDT con el tiempo.) 
b i,Hay evidencia de que la media para pelfcanos jovenes excede la de polluelos en mas de .01 ppm? 

i Limite el valor p usando una tabla del apendice. 

ii Ejercicio Applet Encuentre el valor exacto de p usando la aplicacion apropiada. 

10.71 En condiciones normales, ),el promedio de temperatura corporal es igual para hombres y mujeres? 

Investigadores medicos interesados en esta pregunta recolectaron datos de un gran numero de hombres y 
mujeres, y en la siguiente tabla se presentan muestras aleatorias de los datos. 14 ^Hay suficiente evidencia 
para indicar que las temperatures corporales medias difieren para hombres y mujeres? 


Temperatures corporales (°F) 

Hombres 

Mujeres 

96.9 

97.8 

97.4 

98.0 

97.5 

98.2 

97.8 

98.2 

97.8 

98.2 

97.9 

98.6 

98.0 

98.8 

98.6 

99.2 

98.8 

99.4 


a Limite el valor de p, usando una tabla del apendice. 
b Ejercicio Applet Calcule el valor p. 

10.72 Un artfculo en American Demographics investigo los habitos de consumo en un centra comercial. 

Tendemos a gastar mas dinero en compras durante los fines de semana, en particular en domingos entre 
las 4:00 y las 6:00 p.m. Los compradores gastan menos los miercoles por la manana. 15 Se seleccionaron 


14. Fuente: Journal of Statistics Education Data Archive, http://www.amstat.org/publications/jse/jse-data- 
archive.html, marzo de 2006. 

15. Fuente'. John Fetto, “Shop Around the Clock”, American Demographics, septiembre de 2003, p. 18. 
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muestras aleatorias independientes de compradores y se registro la cantidad gastada por viaje al centra 
comercial, como se indica en la siguiente tabla: 


Fines de semana 

Dfas habiles 

«i =20 

n 2 = 20 

y l = $78 

y 2 — $67 

si = $22 

s 2 = $20 


a i,Hay suficiente evidencia para decir que existe una diferencia en la cantidad promedio gastada por 
viaje en fines de semana y en dfas habiles? Use a = .05. 

b ^Cual es el nivel de significancia alcanzado? 

10.73 En el Ejercicio 8.83, presentamos algunos datos recolectados en un estudio hecho por Susan Beckham y 
sus colegas. En este estudio se hicieron mediciones de la presion del compartimento anterior del muscu¬ 
lo (en milfinetros de mercurio) para diez corredores sanos y diez ciclistas tambien sanos. El resumen de 
datos se repite aqul para comodidad del lector. 


Corredores 


Ciclistas 

Condition Media 

s 

Media s 

Reposo 14.5 

3.92 

11.1 

3.98 

80% consumo max. 12.2 

3.49 

11.5 

4.95 

de O 2 





a i,Hay suficiente evidencia para que se justifique decir que existe diferencia en las presiones medias 
del compartimento anterior del musculo para corredores y ciclistas que esten en reposo? Use a = .05. 
Limite o determine el valor p respectivo. 

b ^Existe suficiente evidencia para permitirnos identificar una diferencia en las presiones medias del 
compartimento anterior del musculo para corredores y ciclistas al 80% de maximo consumo de 0 2 ? 
Use a = .05. Limite o determine el valor p respectivo. 

10.74 Consulte el Ejercicio 8.88. Un informe de una prueba de laboratorio dice que, para estas especies de 
peces, el promedio de medicion de LC50 es de 6 ppm. Use los datos del Ejercicio 8.88 para determinar 
si existe suficiente evidencia para indicar que el promedio de mediciones de LC50 es menor que 6 ppm. 
Use a — .05. 

10.75 El enorme crecimiento de la industria de la langosta de la Florida (llamada langosta espinosa ), en los 
ultimos 20 afios, ha hecho que esta sea la segunda industria de pesca mas valiosa del estado. Se esperaba 
que una declaration del gobiemo de las Bahamas, que prohibfa a Pescadores de Estados Unidos pescar 
en la parte de la plataforma continental de las Bahamas, redujera considerablemente la pesca en libras 
por trampa de langosta. De acuerdo con los registros, la pesca media anterior por trampa era de 30.31 
libras. Un muestreo aleatorio de 20 trampas de langosta desde que la restriction de pesca impuesta por 
el gobierno de las Bahamas entro en vigor aporto los siguientes resultados (en libras): 


17.4 

18.9 

39.6 

34.4 

19.6 

33.7 

37.2 

43.4 

41.7 

27.5 

24.1 

39.6 

12.2 

25.5 

22.1 

29.3 

21.1 

23.8 

43.2 

24.4 


^Estos datos son suficiente evidencia para apoyar la afirmacion de que la pesca media por trampa ha 
disminuido desde la imposition de las restricciones por el gobiemo de las Bahamas? Pruebe usando 
a = .05. 
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10.76 Jan Lindhe realizo un estudio 16 sobre el efecto de un enjuague bucal contra la acumulacion de placa en 
los dientes. Catorce pacientes, cuyos dientes se limpiaron y pulieron muy bien, fueron asignados aleato- 
riamente a dos grupos de siete personas cada uno. A ambos grupos se les indico usar enjuagues bucales 
(sin cepillarse) durante un periodo de 2 semanas. El grupo 1 utilizo un enjuague que contenfa un agente 
contra la acumulacion de placa; el grupo 2 de control recibio un enjuague bucal similar, excepto que, sin 
que los pacientes lo supieran, el enjuague no contema el agente contra la acumulacion de placa. El fndice 
de placa y, que es una medida de la acumulacion de placa, se registro a los 4, 7 y 14 dfas. La media y la 
desviacion estandar para las mediciones de placa de 14 dfas para los dos grupos se dan en la siguiente 
tabla: 


Grupo de control Grupo contra la placa 

Tamano muestral 7 7 

Media 1.26 .78 

Desviacion estandar .32 .32 


a Exprese las hipotesis nula y alternativa que deberfan usarse para probar la efectividad del enjuague 
bucal contra la placa. 

b ^Los datos dan suficiente evidencia para indicar que el enjuague bucal contra la placa es efectivo? 

Pruebe usando a = .05. 
c Limite o encuentre el valor p para la prueba. 

10.77 En el Ejercicio 8.90 presentamos un resumen de datos respecto a calificaciones del Examen de Evaluacion 
Escolar (SAT, por sus siglas en ingles) verbal y de matematicas para estudiantes de preparatoria que 
pretendfan una especializacion en ingenierfa o en idiomas y literatura. Los datos se resumen en la tabla 
siguiente: 


Especializacion probable 

Verbal 

Matematicas 

Ingenierfa (n = 15) 

y = 446 s = 42 

y = 548 s — 57 

Idiomas/literatura (n = 15) 

y = 534 s = 45 

y = 517 i=52 


a (,Hay suficiente evidencia para indicar una diferencia en las calificaciones medias verbales del SAT 
para estudiantes de preparatoria que pretenden una especializacion en ingenierfa y en idiomas/ lite¬ 
ratura? Limite o determine el valor p respectivo. ^Que concluirfa usted en el nivel de significancia de 
a = .05? 

b /.Los resultados obtenidos en el inciso a son consistentes con los obtenidos en el Ejercicio 8.90(a)? 
c Conteste las preguntas planteadas en el inciso a con relacion a las calificaciones medias de matema¬ 
ticas del SAT para los dos grupos de estudiantes. 

d /.Los resultados obtenidos en el inciso c son consistentes con los obtenidos en el Ejercicio 8.90(b)? 


10.9 Pruebas de hipotesis referentes a varianzas 

De nuevo suponga que tenemos una muestra aleatoria Y t , Y 2 , , Y n de una distribucion 

normal con media p. desconocida y varianza cr 2 desconocida. En la Seccion 8.9 empleamos el 
metodo de pivote para construir un intervalo de confianza para el parametro cr 2 . En esta sec¬ 
cion analizaremos el problema de probar Hq .ct 1 = <t ( 2 para algtin valor fijo cr 0 2 contra varias 


16. Fuente : Jan Lindhe, “Clinical Assessment of Antiplaque Agents”, Compendium of Continuing Education in 
Dentistry, supl. no. 5, 1984. 
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hipotesis alternativas. Si H 0 es verdadera y cr 2 = <r 2 , el Teorema 7.3 implica que 

2 (n - 1 )S 2 

X~ = -2- 

°o 

tiene una distribucion x 2 con n ~ 1 grados de libertad. Si deseamos probar Hq-.o 2 = <Tq con¬ 
tra H a : a 1 > ctq, podemos usar x 2 = (« — i).S ' 2 /oq como nuestro estadfstico de prueba, pero 
^como debemos seleccionar la region de rechazo RR? 

Si H a es verdadera y el valor real de cr 2 es mayor que <r ( 2 . esperarfamos que .S 2 (que estima 
el verdadero valor de cr 2 ) fuera mayor que Oq. Cuanto mas grande sea S 2 con respecto a cr ( j, 
mas fuerte es la evidencia que apoye H a :cr 2 > cr, 2 . Observe que S 2 es grande con respecto 
a ctq si y solo si x 2 = ( n ~ i ).S 2 /cr, 2 es grande. Entonces, vemos que una region de rechazo 
de la forma RR = {x 2 > k] para alguna constante k es apropiada para probar Hq : cr 2 = <Tq 
contra H a :cr 2 > <y ( 2 . Si deseamos una prueba para la cual la probabilidad de un error tipo I 
es a, usamos la region de rechazo 

RR= U 2 >* a 2 }, 

donde P(x 2 > A', 2 ) = a (Valores de Xa se pueden hallar en la Tabla 6, Apendice 3.) Una 
ilustracion de esta region de rechazo se encuentra en la Figura 10.10(a). 

Si deseamos probar H(,:a 2 = ctq contra H a \cr 2 < cr, 2 (una alternativa de cola inferior), 
un razonamiento analogo lleva a una region de rechazo ubicada en la cola inferior de la dis¬ 
tribucion x 2 - Por otra parte, podemos probar H<,: a 2 = cr { 2 contra H a \cr 2 ^ a ( 2 (una prueba 
de dos colas) si usamos una region de rechazo de dos colas. Las graficas que ilustran estas 
regiones de rechazo se dan en la Figura 10.10. 





(c) 
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Pruebas de hipotesis referentes a una varianza poblacional 

Supuestos: Iff, Y 2 ,.. ., Y n constituyen una muestra aleatoria de una distribucion nor¬ 
mal con 


E{Y) = ii y V (TQ = a 2 . 


Hq\o~ = a. 




2 2 
-°o 

.2 7 


> off 

^ < Ob 2 


^ * off 

Estadfstico de prueba: = 

Region de rechazo: 


(alternativa de cola superior), 
(alternativa de cola inferior), 
(alternativa de dos colas). 

(n - 1)S 2 


* 2 > xl 

X 1 < Xii- a 

X 2 > Xa /2 O X 2 < xLa /2 


(RR de cola superior). 
(RR de cola inferior) 
(RR de dos colas). 


Observe que Xa se elige de modo que, para v = n — 1 grados de libertad, P(x 2 > 
Xa) = “ (Vea la Tabla 6, Apendice 3.) 


EJEMPLO 10.16 Una compafua produce piezas maquinadas para motor que se supone tienen una varianza en 
diametro no mayor que .0002 (diametros medidos en pulgadas). Una muestra aleatoria de diez 
piezas dio una varianza muestral de .0003. Pruebe, en el nivel de 5%, H 0 : a 2 = .0002 contra 
H a : a 2 > .0002. 

Solucion Si es razonable suponer que los diametros medidos estan distribuidos normalmente, el esta¬ 
dfstico de prueba adecuado es ^ 2 = (« — 1 ).S -2 /rrff. Como hemos planteado una prueba de 
cola superior, rechazamos H 0 por valores de este estadfstico mayores que ^ 2 5 = 16.919 (con 
base en 9 grados de libertad). El valor observado del estadfstico de prueba es 


(n - l)s 2 


(9)(.0003) 

33002 


Entonces, H 0 no es rechazada. No hay suficiente evidencia para indicar que a 2 excede de 
.0002 en el nivel de significance de 5%. ■ 


EJEMPLO 10.17 Determine el valor p relacionado con la prueba estadfstica del Ejemplo 10.16. 

El valor p es la probabilidad de que una variable aleatoria x~ con 9 grados de libertad sea 
mayor que el valor observado de 13.5. El area correspondiente a esta probabilidad esta som- 
breada en la Figura 10.11. A1 examinar la fila correspondiente a 9 grados de libertad en la 


Solucion 
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FIGURA 10.11 
llustracion del valor 
p para el Ejemplo 
1 0.1 7 (densidad 
X 2 con 9 grados 
de libertad) 



Tabla 6, Apendice 3, encontramos que x] = 14.6837. Como indica la Figura 10.11, el area 
sombreada excede de .1, y entonces el valor p es mayor que .1. Esto es, para cualquier valor 
de a < .1, la hipotesis nula no puede ser rechazada. Esto esta acorde con la conclusion del 
Ejemplo 10.16. 

El valor exacto de p se obtiene facilmente usando la aplicacion Chi-Square Probability 
and Quantiles. Como se indica en la Figura 10.11, requerimos P(x 2 > 13.5). Cuando x 2 
tiene 9 grados de libertad, como en la presente situacion, la aplicacion da P (x 2 > 13.5) = 
.14126. ■ 


EJEMPLO 10.18 Un experimentador esta convencido de que la variabilidad en su equipo de medicion resulta 
en una desviacion estandar de 2. Dieciseis mediciones dieron como resultado s 2 = 6.1. ( ',Los 
datos contradicen su afirmacion? Determine el valor p para la prueba. ^Que concluirfa usted 
si elige a = .05? 

Solucion Requerimos una prueba de H 0 : cr 2 = 4 contra H a : <r 2 i= 4, una prueba de dos colas. El valor 
del estadlstico de prueba es x 2 = 15(6.l)/4 = 22.875. Si consultamos la Tabla 6, Apendice 
3, vemos que, para 15 grados de libertad = 24.9958 y x\q = 22.3072. Entonces, la parte 
del valor p que cae en la cola superior esta entre .05 y . 10. Como necesitamos tomar en cuenta 
un area correspondiente igual en la cola inferior (esta area tambien esta entre .05 y . 10), se de¬ 
duce que .1 < valor p < .2. Usando la aplicacion Chi-Square Probability and Quantiles para 
calcular el valor exacto de p, obtenemos P (x 2 > 22.8750) = .0868, y ese valor p = 2(.0868) 
= .1736. Ya sea que usemos los limites obtenidos de la Tabla 6 o el valor p exacto obtenido 
de la aplicacion, es evidente que el valor seleccionado de a = .05 es menor que el valor p; 
por tanto, no podemos rechazar lo dicho por los experimentadores en el nivel de a = .05. 


A veces deseamos comparar las varianzas de dos distribuciones normales, particularmente 
al probar para determinar si son iguales. Estos problemas se encuentran al comparar la pre¬ 
cision de dos instrumentos de medicion, la variacion en las caracterfsticas de calidad de un 
producto manufacturado o la variacion en las calificaciones para dos procedimientos de prue¬ 
ba. Por ejemplo, suponga que T n , T 12 ,..., }j f , y T 2 1 » T 22 , ■ ■ ■, T2n 2 son muestras aleatorias 
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independientes de distribuciones normales con medias desconocidas y que V(T 1( ) = of y 
V(Y 2i ) = of, donde erf y of son incognitas. Suponga que deseamos probar la hipotesis nula 
Hq : of = of contra la alternativa H a : erf > of. 

Como las varianzas muestrales Sf y Sf estiman las respectivas varianzas poblacionales, 
rechazamos H 0 a favor de H a si Sf es mucho mayor que Sf. Esto es, usamos una region de 
rechazo RR de la forma 


RR = 



k 


donde k se elige de modo que la probabilidad de cometer un error tipo I sea a. El valor apro- 
piado de k depende de la distribucion de probabilidad del estadfstico Sf/Sf. Observe que 
(«i — l)Sf /erf y (n 2 — 1) Sf /erf son variables aleatorias independientes x 2 - De la Definition 
7.3 se deduce que 

F _ (»i ~ 1)5? j (n 2 ~ l)5f _ 5^of 
<rf(n\ - 1)/ of(n 2 - 1) Sfcrf 


tiene una distribucion F con (n, — 1) grados de libertad en el numerador y (n 2 — 1) grados de 
libertad en el denominador. Dada la hipotesis nula que of = of, se deduce que F = Sf/Sf 
y la region de rechazo RR dada antes es equivalente a RR = { F > k 1 = {F > F a }, donde k 
= F a es el valor de la distribucion F con v, = (n ] — 1 j y v 2 = (n 0 — 1) tal que P (F > F a ) = 
a. En la Tabla 7, Apendice 3 se dan valores de F a . Esta region de rechazo se muestra en la 
Figura 10.12. 


FIGURA 10.12 
Region de 
rechazo RR para 
probar H 0 : erf = erf 

contra : erf > er\ 
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EJEMPLO 10.19 

Suponga que deseamos comparar la variacion en los diametros de las piezas producidas por 
la empresa del Ejemplo 10.16, con la variacion en los diametros de las piezas producidas 
por un competidor. Recuerde que la varianza muestral para nuestra companfa, basada en n 
= 10 diametros, fue s\ = .0003. En contraste, la varianza muestral de las mediciones de 
diametro para 20 de las piezas del competidor fue ,y 2 = .0001. <',Los datos proporcionan 
suficiente information para indicar una variacion mas pequena en diametros para el compe¬ 
tidor? Pruebe usando a = .05. 

Solucion 

Estamos probando H 0 : cr j 2 = of contra la alternativa H a :of > of El estadfstico de prueba, 
F = (S[ /Sf), esta basado en v { = 9 grados de libertad en el numerador y v 2 = 19 en el de- 
nominador, y rechazamos H 0 para valores de F mayores que F 05 = 2.42. (Vease la Tabla 7, 
Apendice 3.) Como el valor observado del estadfstico de prueba es 

s 2 .0003 

F - 1 - - 3 

s 2 .0001 


vemos que F > f’ (l5 ; por tanto, en el nivel a = .05, rechazamos // (l : of = of a favor de 
H a : of > 07 y concluimos que la companfa competidora produce piezas con menor variacion 
en sus diametros. ■ 


EJEMPLO 10.20 

Limite el valor p relacionado con los datos del Ejemplo 10.19. Use la aplicacion F-Ratio 
Probabilities and Quantiles para determinar el valor exacto de p. 

Solucion 

El valor F calculado para esta prueba de cola superior es F = 3. Como este valor esta basado 
en Vj = 9 y v, = 19 grados de libertad para numerador y denominador, respectivamente, la 
Tabla 7, Apendice 3, se puede usar para determinar que F (P5 = 2.88 mientras que F 0l = 3.52. 
Entonces, el valor observado, F = 3, llevarfa al rechazo de la hipotesis nula para a = .025 
pero no para a = .01. En consecuencia, .01 < valor p < .025. 

Requerimos el valor p = P (F > 3) cuando F tiene una distribucion F con iq = 9 grados 
de libertad para numerador y v 2 = 19 grados de libertad para denominador. El uso directo de 
la aplicacion da como resultado P (F> 3) = .02096, un valor ubicado claramente entre .01 y 
.025, como esta indicado por los lfmites para el valor p obtenido de la Tabla 7. ■ 


Suponga que, para el Ejemplo 10.19, nuestra hipotesis de investigacion fue H a : cr 2 < oy. 
( ',C 6 mo continuarfamos? Estamos en libertad de identificar cualquier poblacion como la po- 
blacion 1. Por tanto, si intercambiamos simplemente las marcas arbitrarias de 1 y 2 en las dos 
poblaciones (y los correspondientes identificadores en tamanos muestrales, varianzas muestra- 
les, etc.), nuestra hipotesis alternativa se convierte en H a : of > of, V podemos continuar como 
antes. Esto es, si la hipotesis de investigacion es que la varianza de una poblacion es mayor que 
la varianza en otra poblacion, identificamos la poblacion con la varianza hipotetica mayor como 
poblacion 1 y continuamos como se indica en la solucion del Ejemplo 10.19. 
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,,, 2 2 

Prueba de hipotesis cr, = cr 2 

Suposiciones: muestras independientes de poblaciones normales. 


Ha 


H a : of > oj. 


S? 

Estadfstico de prueba: F = 

S 2 


Region de rechazo: F>F a , donde F a se elige para que P (F > F a ) = a donde F tiene 
V| = n l — 1 grados de libertad en el numerador y v 2 = n 2 — 1 grados de libertad en 
el denominador. (Vease la Tabla 7, Apendice 3.) 


Si deseamos probar H 0 : of = of contra H a : of ^ of con la probabilidad a de cometer un 
error tipo I, podemos emplear F = S\ /S 2 como estadfstico de prueba y rechazar H 0 a favor 
de H a si el valor F calculado esta en la cola superior o la inferior a/2 de la distribucion F. Los 
valores crfticos de cola superior se pueden determinar directamente de la Tabla 7, Apendice 3; 
pero, ^como determinamos los valores crfticos de cola inferior? 

Observe que F = S\ /S\ v F 1 = S 2 /.Sf tienen distribuciones F, pero los grados de liber¬ 
tad en numerador y denominador se intercambian (el proceso de inversion cambia los papeles 
del numerador y el denominador). Denotemos con F b una variable aleatoria con una distri¬ 
bucion F con a y b grados de libertad en numerador y denominador, respectivamente, y sea 

Fla /2 tal q Ue 


P(F b > F b % /2 ) = a/2. 


Entonces 

^[(^) _ ‘< {F b “ al2 y']=a/2 


y, por tanto, 

P[F b a < Ka/l)'} = */2. 

Esto es, el valor que corta un area de cola inferior de a/2 para una distribucion F/’ se puede 
hallar al invertir F b a/2 . Por tanto, si usamos F = S\/S\ como estadfstico de prueba para pro¬ 
bar // (l : of = of contra H a : a f =/ of, la region de rechazo apropiada es 


RR = {F > F n n \Z{ a/2 o F < (C-W^ 1 }■ 


Una prueba equivalente (vea el Ejercicio 10.81) se obtiene de la siguiente manera. Denote 
con n L y n s los tamanos muestrales relacionados con las varianzas muestrales mayor y menor, 
respectivamente. Ponga la varianza muestral mayor en el numerador y la varianza muestral 
menor en el denominador del estadfstico F y rechace // 0 : of = of a favor de H a : cr f =/ (J i s i 
F > F a , 2 , donde F a , 2 esta determinada por Vj = n L — 1 y v 2 = n s — 1 grados de libertad en 
numerador y denominador, respectivamente. 


EJEMPLO 10.21 Un experimento para explorar los umbrales del dolor provocados por descargas electricas para 
hombres y mujeres arrojo el resumen de datos que aparecen en la Tabla 10.4. ( ' Los datos apor- 
tan suficiente evidencia para indicar una diferencia considerable en la variabilidad de umbrales 
del dolor para hombres y mujeres? Use a = .10. ( : ,Que se puede decir acerca del valor pi 
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Tabla 10.4 Datos para el Ejemplo 10.21 



Hombres 

Mujeres 

n 

14 

10 

y 

16.2 

14.9 

s 2 

12.7 

26.4 


Solucion 


Supongamos que los umbrales del dolor para hombres y mujeres estan distribuidos normal- 
mente en forma aproximada. Deseamos probar H {] : a ^ = cr| contra H a : cr^ ^ cr|, donde 
°m y °f son ^ as varianzas de umbrales del dolor para hombres y mujeres, respectivamente. 
La S 2 mayor es 26.4 (la S 2 para mujeres), y el tamano muestral relacionado con la S 2 mayor 
es n L = 10 . La S 2 menor es 12.7 (la S 2 para hombres) y n s = 14 (el numero de hombres de la 
muestra). Por tanto, calculamos 


F 


26.4 

LL7 


2.079, 


y comparamos este valor con F a , 2 = F 05 con v x = 10 — 1 = 9 y v 2 = 14—1 = 13 grados de 
libertad en numerador y denominador, respectivamente. Dado que F 05 = 2.71 y como 2.079 
no es mayor que el valor crltico (2.71), no existe evidencia suficiente para respaldar la ahrma- 
cion de que la variabilidad de umbrales del dolor difiere para hombres y mujeres. 

El valor p relacionado con el valor observado de F para esta prueba de dos colas se puede 
limitar de la siguiente manera. De acuerdo con la Tabla 7, Apendice 3, con v, = 9, v 2 = 13 
grados de libertad en numerador y denominador, respectivamente, encontramos F 10 = 2.16. 
Entonces, valor/? > 2(. 10) =.20. A menos que estemos dispuestos a trabajar con un valor muy 
grande de a (algun valor mayor que .2), estos resultados no nos permitirfan concluir que las 
varianzas de los umbrales del dolor diheren para hombres y mujeres. 

El valor p exacto se obtiene facilmente usando la aplicacion F-Ratio Probabilities and 
Quantiles. Con 9 grados de libertad en el numerador y 13 en el denominador, P (F> 2.079) = 
.1005 y el valor/? = 2(.1005) = .2010, un valor mayor que .20, como se determina mediante 
el uso de la Tabla 7. ■ 


Aun cuando hemos empleado la notation F en el Ejemplo 10.21 para denotar la razon con 
la S 2 mayor en el numerador y la S 2 menor en el denominador, esta razon no tiene una distribu¬ 
tion F (observe que la razon dehnida en esta forma debe ser mayor o igual a 1). Sin embargo, 
las tablas de la distribution F se pueden usar para determinar la region de rechazo para una 
prueba de nivel a (vea el Ejercicio 10.81). 

Las pruebas de x 2 y de F presentadas en esta section son muy sensibles a desviaciones res- 
pecto a la suposicion de normalidad de las poblacion(es) subyacente(s). Entonces, a diferencia 
de las pruebas t de la Section 10.8, estas pruebas no son robustas si se viola la suposicion de 
normalidad. 


Ejercicios 

10.78 Un fabricante de cascos de seguridad para trabajadores de la construction esta interesado en la media y 
la varianza de las fuerzas que sus cascos transmiten a quienes los usan cuando se someten a una fuerza 
externa normal. El fabricante desea que la fuerza media transmitida por los cascos sea de 800 libras (o 
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menos), bastante abajo del li'mite legal de 1000 libras, y desea que cr sea menor que 40. Se ejecutaron 
pruebas en una muestra aleatoria de n = 40 cascos, encontrando que la media muestral y la varianza eran 
iguales a 825 libras y 2350 libras 2 , respectivamente. 

a Si (jl = 800 y cr = 40, ^es probable que cualquier casco sometido a la fuerza externa normal transmita 
una fuerza de mas de 1000 libras al usuario? Explique. 
b ^Los datos proporcionan suficiente evidencia para indicar que cuando se someten a la fuerza externa 
normal, los cascos transmiten una fuerza media de mas de 800 libras? 
c ^Los datos aportan suficiente evidencia para indicar que a excede de 40? 

10.79 Un fabricante de maquinas para empacar jabon en polvo afirma que su maquina podrfa cargar cajas con 
un peso dado y una variacion de no mas de .4 onzas. Se encontro que la media y la varianza de una mues¬ 
tra de ocho cajas de 3 libras fue de 3.1 y .018, respectivamente. Pruebe la hipotesis de que la varianza de 
la poblacion de mediciones de peso es cr 2 = .01 contra la alternativa de que cr 2 > .01. 

a Use un nivel de significancia de cr = .05. ^Que suposiciones se requieren para esta prueba? 
b ^Que puede decirse acerca del nivel de significancia alcanzado usando una tabla del apendice? 
c Ejercicio Applet ^Que se puede decir acerca del nivel de significancia obtenido usando la aplicacion 
apropiada? 

10.80 i,Con que suposiciones puede usarse la distribucion F para hacer inferencias acerca de la razon entre 
varianzas poblacionales? 

10.81 En dos poblaciones normales con varianzas respectivas de of y of, observamos varianzas muestrales 

independientes S 2 y Sf, con correspondientes grados de libertad — 1 y v 2 = n 2 — 1. Deseamos 

probar H 0 : of = of contra H a : of ^ of. 

a Demuestre que la region de rechazo dada por 

[ F >Kl a ,2 o f<(f;%/ 2 )" 1 }, 

donde F = S\/S\, es la misma region de rechazo dada por 

{s 2 jSl>Fll a/2 o Sl/S\ >FH a/2 \ 

b Denote con S\ la mayor de 5 2 y Sf y denote con Sj la menor de S 2 y Sf. Denote con v L y v s los 
grados de libertad asociados con S 2 y if, respectivamente. Use el inciso a para demostrar que, de 
acuerdo con H 0 , 

p(s 2 l /s 2 s > f;% / 2 ) = a. 

Observe que esto proporciona un metodo equivalente para probar la igualdad de dos varianzas. 

10.82 Los Ejercicios 8.83 y 10.73 presentaron algunos datos recolectados en un estudio de 1993 por Susan 
Beckham y sus colegas. En este estudio, mediciones de la presion del compartimento anterior del 
musculo (en milimetros de mercurio) se tomaron para diez corredores sanos y diez ciclistas sanos. Los 
investigadores tambien obtuvieron mediciones de presion para los corredores y ciclistas al maximo 
consumo de 0 2 . El resumen de datos se da en la siguiente tabla. 
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Corredores 

Ciclistas 

Condition 

Media 

5 

Media 

5 

Reposo 

14.5 

3.92 

11.1 

3.98 

80% consumo 

12.2 

3.49 

11.5 

4.95 

max. de O-, 

Consumo max. de CL 

19.1 

16.9 

12.2 

4.67 


a i,Hay suficiente evidencia para apoyar la afirmacion de que la variabilidad en presion del comparti- 
mento anterior del musculo difiere para corredores y ciclistas que esten en reposo? Use a — .05. 

b i ^Que se puede decir acerca del nivel de significancia obtenido usando una tabla del apendice? 
ii Ejercicio Applet ^Que se puede decir acerca del nivel de significancia obtenido usando la aplica- 
cion apropiada? 

c i,Hay suficiente evidencia para apoyar la afirmacion de que la variabilidad en presion del comparti- 
rnento anterior del musculo entre corredores y ciclistas difiere al maximo consumo de CL? Use a = 
.05. 

d i ^Que se puede decir acerca del nivel de significancia obtenido usando una tabla del apendice? 
ii Ejercicio Applet (i Que se puede decir acerca del nivel de significancia obtenido usando la aplica- 
cion apropiada? 

10.83 El gerente de una lecherfa desea comprar una nueva maquina llenadora de botellas y esta considerando 
las maquinas fabricadas por las companfas A y B. Si la robustez, el costo y la comodidad son similares 
en las dos maquinas, el factor decisivo sera la variabilidad de llenados fes preferible la maquina que 
produzca llenados con rnenor varianza). Sean of y cr 2 las varianzas de llenado para maquinas produ- 
cidas por las companfas A y B, respectivamente. Ahora considere varias pruebas de la hipotesis nula 
H 0 : of = cr 2 . Al obtener muestras de llenados de las dos maquinas y usar el estadfstico de prueba 5 2 /5 2 , 
podrfamos establecer como region de rechazo un area de cola superior, un area de cola inferior o un area 
de dos colas de la distribution F, dependiendo de los intereses a servir. Identifique el tipo de region de 
rechazo que serfa mas favorecido por las siguientes personas y explique por que. 

a El gerente de la lecherfa 
b Un vendedor de la companfa A 
c Un vendedor de la companfa B 

10.84 Un experimento publicado en The American Biology Teacher estudio la eficacia de usar 95% de etanol 
y 20% de blanqueador como desinfectantes para eliminar contamination por bacterias y hongos cuando 
se cultivan tejidos de plantas. El experimento se repitio 15 veces con cada uno de los desinfectantes, 
usando berenjenas como el tejido de planta cultivado. 17 Cinco cortes por planta se colocaron en una 
caja de petri desinfectada usando cada uno de los agentes y almacenada a 25°C durante 4 semanas. Las 
observaciones reportadas fueron el numero de cortes de berenjena no contaminados despues de 4 sema¬ 
nas de almacenamiento. La information relevante se da en la siguiente tabla. ^Usted estarfa dispuesto a 
suponer que las varianzas poblacionales subyacentes son iguales? 


Desinfectante 

95% etanol 

20% blanqueador 

Media 

3.73 

4.80 

Varianza 

2.78095 

0.17143 

n 

15 

15 


17. Fuente: Michael Brehm, J. Buguliskis, D. Hawkins, E. Lee, D. Sabapathi, and R. Smith, “Determining Differen¬ 
ces in Efficacy of Two Disinfectants Using t tests”, The American Biology Teacher 58(2), (1996): 111. 
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a ^Que se puede decir acerca del nivel de significancia alcanzado usando la tabla F del apendice? 
b Ejercicio Applet ^Que se puede decir acerca del nivel de significancia obtenido usando la aplicacion 
F-Ratio Probabilities and Quantiles ? 
c ^Que concluirfa usted, con a = .02? 

10.85 Ejercicio Applet Un instrumento de precision esta garantizado para ser preciso con una variacion de 
no mas de 2 unidades. Una muestra de cuatro lecturas de un instrumento en un mismo objeto dio las 
medidas 353, 351, 351 y 355. De el nivel de significancia alcanzado para probar la hipotesis nula a = 
.7 contra la hipotesis alternativa a > .7. 

10.86 Los examenes de aptitud deben producir calificaciones con una gran cantidad de variacion para que un 
administrador pueda distinguir entre personas con baja aptitud y otras de elevada aptitud. El examen es¬ 
tandar empleado por cierta industria ha producido calificaciones con desviacion estandar de 10 puntos. 
Un nuevo examen se aplica a 20 posibles empleados y produce una desviacion estandar muestral de 12 
puntos. ^Las calificaciones del nuevo examen son considerablemente mas variables que las del examen 
estandar? Use a = .01. 

10.87 Consulte el Ejercicio 10.70. i,Hay suficiente evidencia, en el nivel de significancia de 5%, para apoyar 
la conclusion de que la varianza en mediciones de niveles de DDT es mayor para los pelicanos jovenes 
que para los polluelos? 


10.10 Potencia de las pruebas y el lema 
de Neyman-Pearson 

En las siguientes secciones de este capftulo, pasamos de ejemplos practicos de pruebas es- 
tadfsticas a una exposicion teorica de sus propiedades. Hemos sugerido pruebas espectficas 
para varias situaciones practicas de pruebas de hipotesis, pero usted puede preguntarse por 
que seleccionamos esas pruebas en particular. ^Como decidimos sobre los estadfsticos de 
prueba que se presentaron y como sabtamos que habfamos seleccionado las mejores regiones 
de rechazo? 

La bondad de una prueba es medida por a y /3, las probabilidades de errores tipo I y tipo II, 
respectivamente. Por lo general, el valor de a se elige de antemano y determina la ubicacion 
de la region de rechazo. Un concepto relacionado pero muy util para evaluar el desempeno de 
una prueba recibe el nombre de potencia de la prueba. Basicamente, la potencia de una prueba 
es la probabilidad de que la prueba lleve al rechazo de la hipotesis nula. 

DEFINICION 10.3 Suponga que W es el estadfstico de prueba y RR es la region de rechazo para una prueba 
de una hipotesis que involucra el valor de un parametro 6. Entonces la potencia de la 
prueba, denotada por potencia(0), es la probabilidad de que la prueba lleve al rechazo 
de H 0 cuando el valor real del parametro es 6. Esto es, 

potencia! 0) = P (W en RR cuando el valor del parametro es 6). 


Suponga que deseamos probar la hipotesis nula H 0 : 6 = 0 O y que 6 a es un valor particular 
para 9 elegido de II a . La potencia de la prueba en 0 = 9 0 , potencia(0 o ), es igual a la probabi¬ 
lidad de rechazar H 0 cuando H 0 es verdadera. Esto es, potencia(0 o ) = a, la probabilidad de 
cometer un error tipo I. Para cualquier valor de 6 a partir de H a , la potencia de una prueba mide 
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FIGURA 10.13 
Curva tfpica de po¬ 
tencia para la prueba 
de H 0 : 6 = # 0 contra 
la alternativa 

H a -.Q±e 0 



la capacidad de la prueba para detectar que la hipotesis nula es falsa. Esto es, para # = #„, 

potential#,,) = P (rechazar H 0 cuando 0 = 0 a ). 

Si expresamos la probabilidad [3 de cometer un error tipo 11 cuando # = 9 a como [3(0 n ), en- 
tonces 

/3(#„) = P (aceptar H 0 cuando 6 = 6 a ). 

Se deduce que la potencia de la prueba en 6 a y la probabilidad de cometer un error tipo II estan 
relacionados de la siguiente manera. 


Relation entre potencia y /3 

Si 6 a es un valor de 0 en la hipotesis alternativa H a , entonces 

potential#,,) = 1 - /3(#„). 


Una cun’a de potencia tfpica, una grafica de potential#), se ilustra en la Figura 10.13. 
Idealmente, una prueba detectarfa una desviacion desde H 0 : 0 = 9 0 con certeza; esto es, 
potencia(# fl ) serfa 1 para toda #„ en H a (vea la Figura 10.14). Porque, para un tamano muestral 
fijo, ayjSno pueden hacerse arbitrariamente pequenos, es evidente que esto no es posible. 
Por tanto, para un tamano muestral fijo n, adoptamos el procedimiento de seleccionar un valor 
(pequeno) para a y hallar una region de rechazo RR para minimizar (3(0 a ) en cada #„ en II a . 
De manera equivalente, seleccionamos RR para maximizar la potential#) para # en H a . De 
entre todas las pruebas con nivel de significancia de a, buscamos la prueba cuya funcion de 
potencia se acerque mas a la funcion de potencia ideal (Figura 10.14) si existe esa prueba. 
( ',C6mo determinamos este procedimiento de prueba? 

Antes de continuar, debemos definir las hipotesis simple y compuesta. Suponga que Fj, 
Y 2 ,..., Y n constituyen una muestra aleatoria de una distribution exponencial con parametro 


FIGURA 10.14 
Curva ideal 
de potencia para la 
prueba de H 0 : 6 = # 0 
contra H a : 6 A # 0 


Potencia ( 6 ) 


i 



8 0 0 
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DEFINICION 10.4 


TEOREMA 10.1 


A; esto es, f(y) = (1 /y)e~ y ^ K , y> 0. Entonces la hipotesis H : A = 2 especifica de manera unica 
la distribucion de la cualse toma la muestra y que tiene funcion dedensidad/(y) = (1 / 2)e ~ y / 2 , 
y > 0. La hipotesis H : A = 2 es, por tanto, un ejemplo de una hipotesis simple. En contras- 
te, la hipotesis H* : A > 2 es una hipotesis compuesta porque dada H* la funcion de den¬ 
sidad/(y) no esta determinada de manera unica. La forma de la densidad es exponencial, 
pero el parametro A podrra ser 3 o 15 o cualquier valor mayor que 2. 


Si se toma una muestra aleatoria de una distribucion con parametro 9, se dice que una 
hipotesis es simple si especifica de manera unica la distribucion de la poblacion de la 
cual se toma la muestra. Cualquier hipotesis que no sea simple se denomina hipotesis 
compuesta. 


Si Fj, Y 2 , ■ ■ ■ , Y n representan una muestra aleatoria de una distribucion normal con varianza 
conocida cr 2 = 1, entonces H : p. = 5 es una hipotesis simple porque, si H es verdadera, 
la funcion de densidad esta especificada de manera unica para ser una funcion de densidad 
normal con p. = 5y cr 2 = 1. Si, por otro lado, cr 2 no se conoce, la hipotesis II: p = 5 determina 
la media de la distribucion normal pero no determina el valor de la varianza. Por tanto, si cr 2 
no se conoce, H : p, = 5 es una hipotesis compuesta. 

Supongamos que nos gustarra probar una hipotesis nula simple H 0 : 9 = 9 0 contra una hipo¬ 
tesis alternativa simple H a : 9 = 9 a . Como estamos interesados solo en dos valores particulares 
de 9 ( 9 0 y 9J, nos gustarra escoger una region de rechazo RR para que a = potential 0 O ) sea 
un valor fijo y potential0 n ) sea tan grande como sea posible. Esto es, buscamos la mas potente 
prueba de nivel a. El siguiente teorema proporciona la metodologra para obtener la mas po¬ 
tente prueba para probar H 0 simple contra H a simple. [Nota: al igual que en la Definition 9.4, 
usamos la notation L (9) = L (y ,, y 2 , ... , y„\9) para indicar que la funcion de verosimilitud 
depende de y u y 2 , ... , y n y de 9.] 


El lema de Neyman—Pearson Suponga que deseamos probar la hipotesis nula simple 
H 0 : 9 = 9 0 contra la hipotesis alternativa simple H a : 9 = 9 a , con base en una muestra 
aleatoria Y x , V 2 , . . ., Y n de una distribucion con parametro 9. Sea L (6) la verosimilitud 
de la muestra cuando el valor del parametro es 9. Entonces, para una a dada, la prueba 
que maximiza la potencia en 9 a tiene una region de rechazo, RR, determinada por 


L(9 a ) 

El valor de k se escoge de modo que la prueba tenga el valor deseado para a. Esta prueba 
es la mas potente en el nivel a para H 0 contra H a . 


La demostracion del Teorema 10.1 no se incluye aquf, pero se puede encontrar en algunos 
de los textos citados en la bibliografla al final de este capftulo. llustramos la aplicacion del 
teorema con el siguiente ejemplo. 
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EJEMPLO 10.22 Suponga que Y representa una sola observation de una poblacion con funcion de densidad de 
probabilidad dada por 


f(y\0) 


#/"', 0 < y < 1, 

0, en cualquier otro punto. 


Encuentre la mas potente prueba con nivel de significancia a = .05 para probar H 0 : 6 = 2 
contra H a : 6 = 1. 


Solution Como ambas hipotesis son simples, el Teorema 10.1 puede aplicarse para obtener la prueba 
requerida. En este caso, 


L(Oo) _ /(>’ |^o) = 2 y 
L(6 a ) f{y\6 a ) (l)y° 


para 0 < y < 1, 


y la forma de la region de rechazo para la mas potente prueba es 


2y < k. 

Del mismo modo, la region de rechazo RR es {y < k/2}. O bien, debido a que k/2 = k* es 
una constante, la region de rechazo es RR: {y < k *). 

Como a = .05 esta especificada, el valor de k* esta determinado por 


.05 = P(Y en RR cuando 0=2 ) 


P(Y < k* cuando 6=2) = f 2 y dy = (, k*) 

Jo 


Por tanto, ( k*) 2 = .05 y la region de rechazo de la mas potente prueba es 

RR: {>- < Vd)5 = .2236} 

Entre todas las pruebas para H 0 contra H a basadas en un tamano muestral de 1 y con a hja en 
.05, esta prueba tiene el maximo valor posible para potenciafd j = potencia(l). De la misma 
manera, entre todas las pruebas con a = .05 esta prueba tiene la minima probabilidad de co¬ 
meter un error tipo II cuando /3 (9J se evalua en 6 a = 1. yCual es el valor real para potential#) 
cuando 0=1? 

potencia(l) = P(Ten RR cuando 0 = 1) = P(Y < .2236 cuando# = 1) 

.2236 

(1) dy = .2236 

Aun cuando la region de rechazo {y < .2236} da el maximo valor para potencia(l) entre to¬ 
das las pruebas con a = .05, vemos que j8(l) = 1 — .2236 = .7764 todavia es muy grande. 



Observe que las formas del estadistico de prueba y la region de rechazo dependen de H 0 y 
H a . Si se cambia la alternativa a H a : # = 4, la prueba mas potente esta basada en Y 2 , y rechaza- 
mos H 0 a favor de H c si Y 2 > k ', para alguna constante k'. Tambien observe que el lema de 
Neyman-Pearson proporciona la forma de la region de rechazo; la region de rechazo real 
depende del valor especihcado para a. 

Para distribuciones discretas, no siempre es posible hallar una prueba cuyo nivel de signifi¬ 
cancia sea exactamente igual a algun valor predeterminado de a. En tales casos, especificamos 
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EJEMPLO 10.23 


Solucion 


que la prueba sea aquella para la cual la probabilidad de cometer un error tipo I sea la mas 
cercana al valor predeterminado de a sin rebasarlo. 

Suponga que hacemos un muestreo de una poblacion cuya distribucion esta especificada 
por completo, excepto para el valor de un solo parametro 6. Si deseamos probar H 0 : 9 = H 0 
(simple) contra H a : 0 > 6 0 (compuesta), ningun teorema comparable con el Teorema 10.1 
es aplicable si cualquiera de las dos hipotesis es compuesta. No obstante, el Teorema 10.1 se 
puede aplicar para obtener una mas potente prueba para H 0 : 6 = 9 0 contra H a : 6 = 6 a para 
cualquier valor individual 6 a , donde 0 a >0o■ En muchas situaciones, la region de rechazo real 
para la mas potente prueba depende solo del valor de 0 o (y no depende de la seleccion particu¬ 
lar de 6 a ). Cuando una prueba obtenida por el Teorema 10.1 en realidad maximiza la potencia 
para todo valor de 0 mayor que 0 0 , se dice que es una prueba uniformemente mas potente para 
H 0 \ 0 = 0 O contra H a : 6 > 0 o . Observaciones analogas se aplican a la deduccion de pruebas 
para H 0 : 6 = 6 0 contra H a : 0 < 9 0 . Ilustramos estas ideas en el siguiente ejemplo. 


Suponga que Y t , Y 2 ,... ,Y n constituyen una muestra aleatoria de una distribucion normal con 
media pL desconocida y varianza a 2 conocida. Deseamos probar H n : /i = /x 0 contra H a : j± > 
/jlq para una constante especificada /i, t . Encuentre la prueba uniformemente mas potente con 
un nivel de significancia a. 


Empezamos por buscar la prueba nivel a mas potente d eH 0 : p. = /jl 0 contra H* : /i = fi a para 
un valor fijo de p, a que es mayor que /jl 0 . Como 


f(y Im) = 


1 


a/277/ 


exp 


-(>■ - m ) 

2(j 2 


2 1 


- OO < y < OO 


tenemos 


L(p) = f(y 1 1 v)f(y 2 1 a0 ■ ■ ■ f(y n I m) 



(y t ~ a0 2 

^ 2 a 2 


[Recuerde que exp(vv) es simplemente e" en otra forma.] Como H 0 y H* son hipotesis simples, 
el Teorema 10.1 implica que la prueba mas potente d e H 0 : p, = p, 0 contra H*: p. = p a esta 
dada por 


L(p>o) 

L(p>a) 


que en este caso es equivalente a 


c t\/2tt J 



exp 


■ E”=i 


exp 


■E?-i 


(yi - Ak)) 2 

2cr 2 

(yi - Ha) 1 

2 a 2 


< k. 


Esta desigualdad se puede reacomodar como sigue: 


exp 



n 


n 


^2(y> - w) 1 ~ ^2(yi ~ Ma) 2 

i =1 i =1 


< k. 























10.10 Potencia de las pruebas y el lema de Neyman-Pearson 545 


Aplicando logaritmos naturales y simplificando, tenemos 


1 

2er 2 


n 


n 


- mo ) 2 - Y^ ( y> - ^ 2 

i =1 i=l 


< ln(&) 


^(>’i - Mo) 2 - ^(>1 - Mn) 2 > -2o- 2 ln(£) 

i' = l i =1 



n 

2ny/jio + n/jL 0 — > ;y f - 4- 2nyfi a — n/ji a > —2a~\n(k) 

i =1 


y(/x fl - /x 0 ) > 


—2u 2 ln(£) — h/j,q + w/r 2 
2n 


o bien, como /j, a > /x () , 


> > 


—2cr 2 ln(Ar) — + «/x 2 

2«(Ma ~ Mo) 


Como cr 2 , n, /jl 0 y p, a son constantes conocidas todas ellas, la cantidad del lado derecho de la 
desigualdad es una constante; llamemosla k!. Por tanto, la prueba mas potente de //„: p, = p 0 
contra H* : p = p a tiene la region de rechazo dada por 

RR = {y > k'}. 

El valor preciso de k' se determina al fijar a y observar que 

a = P(Y en RR cuando p = p o) 

= P(Y > Ccuando p = po) 

Y ~ Mo k' -/r 0 
<rj\/n cr fsjn 

= P (Z >Vn(k’ - po)/cr ) ■ 



Porque, dada H 0 , Z tiene una distribucion normal estandar, P (Z> z a ) = ct y el valor requerido 
para k' debe satisfacer 

V n{k' — Mo )/cr = Z a , o bien, de manera equivalente, k' = p 0 + z a cr/\/n. 

Entonces, la prueba nivel a que tiene el maximo valor posible para la potencia(0 fl ) esta 
basada en el estadfstico Y y tiene region de rechazo RR = { y > p 0 + z a cr/ \/n}- Ahora ob- 
servamos que ni el estadfstico de prueba ni la region de rechazo para esta prueba nivel a 
dependen del valor particular asignado a p a . Esto es, para cualquier valor de p a mayor que p 0 , 
obtenemos exactamente la misma region de rechazo. Por tanto, la prueba nivel a con la region 
de rechazo previamente dada tiene el maximo valor posible para potencia(/r n ) para toda p a 
> p 0 . Es la prueba uniformemente mas potente para H 0 : p = p 0 contra H a \ p> p 0 . Esta es 
exactamente la prueba que consideramos en la Seccion 10.3. ■ 


De nuevo consideremos el caso en que la muestra aleatoria se toma de una distribucion que 
esta completamente especificada, excepto para el valor de un solo parametro 6. Si deseamos 
obtener una prueba para H 0 : 0 < 6 0 contra H a : 0 > 6 0 (de manera que tanto H 0 como H c sean 
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hipotesis compuestas), ^cdmo procedemos? Suponga que usamos el metodo ilustrado en el 
Ejemplo 10.23 para hallar una prueba uniformemente mas potente para //,'; 9 = 0 O contra 
H a :d>e 0 . Si 0 l es un valor fijo de 9 que es menor que 6 0 y usamos la misma prueba para 
//,>': 9 = 0i contra H c , por lo general, a disminuira y la potencia(0 n ) permanecera sin cam- 
bio para toda 9 a en H a . En otras palabras, si tenemos una buena prueba para discriminar 
entre // ( J y H a , la misma prueba sera todavfa mejor para discriminar entre // 0 " y H c . Para 
pruebas con hipotesis nulas compuestas de la forma H 0 : 9 < 9 0 (o H 0 : 9 > 9 0 ), definimos 
el nivel a de significancia como la probabilidad de un error tipo I cuando 9 = 9 0 \ esto es, 
a = potencia(0 o ). Por lo general, este valor para a es el maximo valor de la funcion de po- 
tencia para 9 < 9 0 (o 9 > 9 0 ). Usando esta metodologfa, podemos demostrar que la prueba 
obtenida en el Ejemplo 10.23 para probar H 0 : 9 = 9 0 contra H a : 9 > 9 0 tambien es la prueba 
uniformemente mas potente nivel a para probar H 0 : 9 < 9 0 contra H a : 9 > 9 0 . 

En el Ejemplo 10.23 obtuvimos la prueba uniformemente mas potente para H 0 : ft, = /jl 0 
contra H a : /x > /jl 0 y encontramos que tiene la region de rechazo {y > /jlq + z. a <r/\/ r n)}. 
Si deseamos probar H 0 : fi = /jl 0 contra H tl : /jl < /j, 0 , calculos analogos nos llevarian a 
{y < /xo — z, e (r/\/7i} como la region de rechazo para la prueba que es uniformemente mas 
potente para toda /x a < /x 0 . Por tanto, si deseamos probar //„: /j. = /x 0 contra H a : \± i= /x 0 , nin- 
guna region de rechazo individual proporciona la prueba mas potente para todos los valores de 
\± a J= jjL () . Aun cuando hay algunas excepciones especiales, en casi todos los casos no existen 
pruebas de dos colas uniformemente mas potentes. Por tanto, hay muchas hipotesis nulas y 
alternativas para las cuales no existen pruebas uniformemente mas potentes. 

El lema de Neyman—Pearson es inutil si deseamos probar una hipotesis acerca de un solo 
parametro 9 cuando la distribucion muestreada contiene otros parametros no especificados. 
Por ejemplo, podrfamos probar H 0 : jx = /jl 0 cuando la muestra se toma de una distribucion 
normal con varianza a 2 desconocida. En este caso, H 0 : jx = /x 0 no determina de manera unica 
la forma de la distribucion (porque cr 2 podrfa ser cualquier numero no negativo) y por tanto no 
es una hipotesis simple. La siguiente section presenta un metodo muy general y ampliamente 
usado para desarrollar pruebas de hipotesis. El metodo es particularmente util cuando estan 
presentes parametros no especificados (llamados parametros de ruido ). 


Ejercicios 

1 0.88 Consulte el Ejercicio 10.2. Encuentre la potencia de la prueba para cada alternativa en a-d. 
a p — .4. 

b p = .5. 
c p = .6. 
d p = .7. 

e Trace una grafica de la funcion de potencia. 

1 0.89 Consulte el Ejercicio 10.5. Encuentre la potencia de la prueba 1 para cada alternativa en a-e. 

a d = .1. 
b 6 = .4. 
c 9 = .7. 
d 6 = 1. 

Trace una grafica de la funcion de potencia. 


e 
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*10.90 Consulte el Ejercicio 10.5. 

a Encuentre la potencia de la prueba 2 para cada una de las siguientes alternativas: 0 = .1, 0 = .4, 0 = 
,7y0 = 1. 

b Trace una grafica de la funcion de potencia. 

c Compare la funcion de potencia del inciso b con la funcion de potencia que haya encontrado en el 
Ejercicio 10.89 (esta es la funcion de potencia para la prueba 1, Ejercicio 10.5). ^Que se puede con¬ 
duit' acerca de la potencia de prueba 2 comparada con la potencia de prueba 1 para toda 0 a 0? 

10.91 Sea T h Y 2 , ... , Y 20 una muestra aleatoria de tamano n = 20 de una distribution normal con media p 
desconocida y varianza cr 2 = 5 conocida. Deseamos probar H 0 : p — 7 contra H a : p> 1. 

a Encuentre la prueba uniformemente mas potente con nivel de significancia .05. 
b Para la prueba del inciso a, encuentre la potencia en cada uno de los siguientes valores altemativos 
para p : p a — 7.5, 8.0, 8.5 y 9.0. 
c Trace una grafica de la funcion de potencia. 

10.92 Considere la situation descrita en el Ejercicio 10.91. ^Cual es el minimo tamano muestral para que una 
prueba de nivel a = .05 tenga potencia de al menos .80 cuando p = 8? 

10.93 Para una distribution normal con media p y varianza a 2 = 25, un experimentador desea probar 
H 0 : p — 10 contra H a : p = 5. Encuentre el tamano muestral n para el cual la prueba mas potente tendra 
a = p = .025. 

10.94 Suponga que F,, Y 2 , , Y n constituyen un muestra aleatoria de una distribution normal con media p 

conocida y varianza a 2 desconocida. Encuentre la prueba nivel a mas potente de H 0 :a 2 = of contra 
H a .cr 2 — of, donde of > of. Muestre que esta prueba es equivalente a una prueba x 2 - (,La prueba es 
uniformemente mas potente para H a : cr > of? 

10.95 Suponga que tenemos una muestra aleatoria de cuatro observaciones de la funcion de densidad 


f(y 1 0) 


»»• 

0, en cualquier otro punto. 


a Encuentre la region de rechazo para la prueba mas potente de H 0 : 0 = 0 O contra H a \ 0 = 9 a , supo- 
niendo que 6 a > 0 O . [Sugerencia: haga uso de la distribution x 2 -] 
b ^,La prueba dada en el inciso a es uniformemente mas potente para la alternativa 0 > 0 O ? 

10.96 Suponga que Y es una muestra aleatoria de tamano 1 desde una poblacion con funcion de densidad 

\dy 6 ~', 0<y<l, 

f(y\W = n ‘ , . 

[0, en cualquier otro punto, 

donde 0 > 0. 

a Trace la funcion de potencia de la prueba con region de rechazo: Y > .5. 

b Con base en la sola observation de T, encuentre una prueba uniformemente mas potente de tamano 
a para probar H 0 : 9 = 1 contra H a : 0 > 1. 

*10.97 Sean yj, Y 2 , . . . , Y n variables aleatorias independientes y distribuidas identicamente con funcion de 
probabilidad discreta dada por 


y 

1 2 3 

p(y 10) 0 2 20(1 -0) (1 -0) 2 


donde 0 < 0 < 1. Denote con (V, el numero de observaciones iguales a i para i = 1, 2, 3. 
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a Obtenga la funcion de probabilidad L ( 8) como funcion de N v N 2 y N 3 . 

b Encuentre la prueba mas potente para probar H 0 \8 = 8 0 contra H a : 8 = 8 a , donde 8 a > 8 0 . Demuestre 
que su prueba especifica que H 0 sea rechazada para ciertos valores de 2/Vj + N 2 . 
c ^Como determina el valor de k para que la prueba tenga nivel nominal a? No necesita hacer el calculo 
real. Una description tiara de como determinar k es adecuada. 
d ^La prueba obtenida en los incisos a-c es uniformemente mas potente para probar H 0 : 8 = 8 0 contra 
H a : 8 > 8 0 ? ^Por que si o por que no? 

10.98 Sea Y v . . . , Y n una muestra aleatoria de la funcion de densidad de probabilidad dada por 


f(y \o) 



y >0, 

en cualquier otro punto. 


con m denotando una constante conocida. 


a Encuentre la prueba uniformemente mas potente para probar H 0 \ 8 = 8 0 contra H a : 8 > d Q . 

b Si la prueba del inciso a ha de tener 8 0 = 100, a = .05 y /3 = .05 cuando 8 a = 400, encuentre el 
tamano muestral apropiado y la region critica. 

10.99 Denote con Y v Y 2 ,..., Y n una muestra aleatoria de una poblacion que tiene una distribution de Poisson 
con media A. 


a Encuentre la forma de la region de rechazo para una prueba mas potente de H 0 : A = A 0 contra H a : A 
= A a , donde A a > A 0 . 

b Recuerde que i tiene una distribucion de Poisson con media n\. Indique el modo en que esta 
information se puede utilizar para determinar constantes asociadas con la region de rechazo obtenida 
en el inciso a. 

c ^,La prueba obtenida en el inciso a es uniformemente mas potente para probar H 0 : A = A 0 contra H a : 
A > A 0 ? ^Por que? 

d Encuentre la forma de la region de rechazo para una prueba mas potente de H 0 : A = A 0 contra H a : A 
= \ a , donde A a < A 0 . 

10.100 Sea Y 1 , Y 2 , . . . , Y n una muestra aleatoria de una poblacion que tiene una distribucion de Poisson con 
media Aj. Denote con X 2 , . . . , X m una muestra aleatoria independiente de una poblacion que tiene 
una distribucion de Poisson con media A 2 . Obtenga la prueba mas potente para probar H 0 : Aj = A 2 = 2 
contra H a : A t = 1/2, A 2 = 3. 

10.101 Suponga que Y v Y 2 , . . . , Y n denotan una muestra aleatoria de una poblacion que tiene una distribucion 
exponential con media 8. 

a Obtenga la prueba mas potente para H 0 : 8 = 8 0 contra H a : 8 = 8 a , donde 8 a < 8 0 . 
b ^,La prueba obtenida en el inciso a es uniformemente mas potente para probar H 0 : 8 = 8 0 contra H a : 
8<8 0 1 

10.102 Sea Y 3 , Y 2 , , Y n una muestra aleatoria de una poblacion con distribucion de Bernoulli y parametro p. 
Esto es. 


piyi I p) = p yi (i - y,-= 0,1. 


a Suponga que estamos interesados en probar H 0 : p = p 0 contra H a \p= p a , donde p 0 < p a . 
i Demuestre que 


L(Po) 

^3 

o 

1 

o 

T.yi 

( l ~P°) 

L(Pa) 

.(1 - Po)Pa. 

Kl-Pa) 
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ii Pruebe que L ( p 0 )/L ( p a ) < k si y solo si y t > k* para alguna constante k*. 

iii Defina la region de rechazo para la prueba mas potente de H 0 contra H a . 

b Recuerde que Y^=i ^ tiene una distribucion binomial con parametros n y p. Indique el modo de 
determinar los valores de cualesquiera constantes contenidas en la region de rechazo obtenidas en el 
inciso [a(iii)]. 

c ^La prueba obtenida en el inciso a es uniformemente mas potente para probar H 0 : p = p 0 contra H a : 
p > p 0 ? ^Por que si o por que no? 

*10.103 Sea Fj, Y 2 , . . . , F„ una muestra aleatoria de una distribucion uniforme en el intervalo (0, 8). 

a Encuentre la prueba nivel a mas potente para probar H 0 : 8 = 8 0 contra H a : 8 = 8 a , donde 8 a < d 0 . 
b ^La prueba obtenida en el inciso a es uniformemente mas potente para probar H 0 : 9 = d 0 contra H a : 

»■ 'V 

*10.104 Consulte la muestra aleatoria del Ejercicio 10.103. 

a Encuentre la prueba nivel a mas potente para probar H 0 : 9 = 9 0 contra H a \ 9 = 9 a , donde 8 a > e 0 . 
b ^La prueba obtenida en el inciso a es uniformemente mas potente para probar H 0 \ 8 = 6 0 contra H a : 

o>e 0 ? 

c ^,Es unica la prueba nivel a mas potente que encontro en el inciso a? 


10.11 Pruebas de razon de probabilidad 

El Teorema 10.1 proporciona un metodo para construir pruebas mas potentes para hipote- 
sis simples cuando se conoce la distribucion de las observaciones, excepto para el valor de 
un parametro individual desconocido. Este metodo puede usarse a veces para hallar pruebas 
uniformemente mas potentes para hipotesis compuestas que comprenden un parametro indi¬ 
vidual. En muchos casos, la distribucion de interes tiene mas de un parametro desconocido. 
En esta seccion presentamos un metodo muy general que se puede usar para obtener pruebas 
de hipotesis. El procedimiento funciona para hipotesis simples o compuestas ya sea que esten 
presentes o no otros parametros con valores desconocidos. 

Suponga que una muestra aleatoria se selecciona de una distribucion y que la funcion de 
probabilidad L(y i, y 2 , .... | y„ \ 0 \, 9t, ■ ■ ■, Ok) es una funcion de k parametros, 6 V 0 2 , ■ ■ ■ , 0 k . 
Para simplificar la notacion, denotemos con 0 el vector de todos los parametros k, es decir, 
0 = (6 j, 0 2 , ■ ■ ■ • 9 k ), y escribimos la funcion de probabilidad como L (0). Puede ser el caso 
que estemos interesados en probar hipotesis solo alrededor de uno de los parametros, por 
ejemplo 0,. Por ejemplo, si, como en el Ejemplo 10.24, tomamos una muestra de una pobla- 
cion distribuida normalmente con media desconocida p, y varianza cr desconocida, entonces 
la funcion de probabilidad depende de los dos parametros jj, y cr 2 y 0 = (/z, cr 2 ). Si estamos 
interesados en probar hipotesis acerca de solo la media /z, entonces cr 2 , que es un parametro 
no de particular interes para nosotros, se denomina parametro de ruido. Por tanto, la funcion de 
probabilidad puede ser una funcion con parametros de ruido desconocidos y un parametro 
de interes. 

Supongamos que la hipotesis nula especifica que 0 (puede ser un vector) se encuentra en un 
conjunto particular de posibles valores, por ejemplo Q 0 , y que la hipotesis alternativa especifica 
que 0 esta en otro conjunto de posibles valores Q . a , que no se traslapa con £2 0 . Por ejemplo, si 
muestreamos de una poblacion con una distribucion exponencial con media A (en este caso, A 
es el unico parametro de la distribucion y 0 = A), podrfamos estar interesados en probar H 0 : 
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A = A 0 contra H a : A =£ A 0 . En este ejemplo exponencial, £2 0 contiene solo el valor individual 
A 0 y Q a = {A > 0 : A ¥= A 0 }. Denote la union de los dos conjuntos, Q 0 y £2 a , por £2; esto es, 
£2 = £2 0 U £2„. En este ejemplo exponencial, £2 = {A 0 } U {A > 0 : A ^ A 0 } = {A: A > 0}, es 
el conjunto de todos los posibles valores para A. Cualquiera de las dos hipotesis H 0 y H a , o 
ambas, pueden ser compuestas porque podrfan contener valores multiples del parametro de 
interes o porque puedan estar presentes otros parametros desconocidos. 

Denotemos con L(£2o) el maximo (en realidad el supremo) de la funcion de verosimilitud 
para toda 0 e £2 0 . Esto es, L{ Q (} ) = max© e£2o L(0). Observe que L(£2o) representa la mejor 
explicacion para los datos observados para toda 0 E £2 0 y puede hallarse mediante meto- 
dos similares a los empleados en la Seccion 9.7. Del mismo modo, L(£2) = max Hen L(0) 
representa la mejor explicacion para los datos observados para toda 0 G £2 = £2 0 U £2„. Si 
L(£2o) = L(£2), entonces una mejor explicacion para los datos observados se puede hallar 
dentro de £2 0 , y no deberfamos rechazar la hipotesis nula H 0 : 0 G £2 0 ; pero si L(£2o) < L(£2), 
entonces la mejor explicacion para los datos observados se puede hallar dentro de £2 fl , y debe¬ 
rfamos considerar rechazar H 0 a favor de H a . Una prueba de razon de probabilidad esta basada 
en la razon L(Q. 0 )/L(Ci). 


Prueba de razon de probabilidades 

Defina A mediante 


Hi 2 0 ) 

L(t 2 ) 


maxL(0) 

max L(0) 
®en 


La prueba de razon de verosimilitudes de H 0 : 0 G £2 0 contra H n : 0 G £2„ emplea A 
como un estadistico de prueba, y la region de rechazo esta determinada por A < k. 


Se puede demostrar que 0 < A < 1. Un valor de A cercano a cero indica que la probabilidad 
de la muestra es mucho menor con H 0 que con H a . Por tanto, los datos sugieren favorecer H a 
sobre H 0 . El valor real de k se selecciona de modo que a alcance el valor deseado. Ilustramos 
la mecanica de este metodo con el siguiente ejemplo. 


EJEMPLO 10.24 Suponga que fj, Y 2 ,. . ., Y n constituyen una muestra aleatoria de una distribucion normal con 
media /j, desconocida y varianza cr 2 desconocida. Deseamos probar H 0 : /jl = /jl 0 contra H a : /jl 
> i jl 0 . Encuentre la prueba de razon de probabilidades adecuada. 

Solucion En este caso, 0 = (/r, cr 2 ). Observe que £2 0 es el conjunto {(/xo, cr 2 ): cr 2 > 0}, Q a = 
{(/ jl , cr 2 ): /r>/r o , cr 2 > 0}, y por tanto que £2 = £2 0 U Q. a = {(/r, cr 2 ): /jl > /jlq, a 2 >0}. 
El valor constante de la varianza cr 2 es completamente no especificado. Debemos ahora hallar 

L(£2 0 ) y L(( 2). 

Para la distribucion normal tenemos 


L(0) = L(/r,o- 2 ) 



(yj P-) 
2cr 2 
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Restringir pi a Q 0 implica que pi = pi 0 , y podemos hallar L(£Iq) si determinamos el valor 
de cr 2 que maximice L (pi, cr 2 ) sujeto a la restriction de que pi = /jl 0 . Del Ejemplo 9.15, vemos 
que cuando pi = /jl 0 el valor de cr 2 que maximiza L cr 2 ) es 

ob 2 = - - Mo) 2 - 

n 

i=i 


Entonces, L(£2o) se obtiene al sustituir \x con /jl 0 y a 2 con ofi en L (jll, cr 2 ), que da 


L(C2 o) = 


,V / 27r 


»/2 


exp 


(Ji Mo) 


i=i 2& 6 


yj2ir 


n/2 


-n/ 2 


Ahora nos concentramos en hallar L(fi). Al igual que en el Ejemplo 9.15, es mas facil ver 
en In L (/ jl , cr 2 ), 

In [L{n, cr 2 )] = lno- 2 - ^In2r7 - ^ ^{yi -pi) 2 . 

1=1 

Evaluando derivadas con respecto a/ry cr 2 , obtenemos 


dQn[E(M, o' 2 )]} 

3pi 

3{lnLL(M, o- 2 )]} 
do- 2 


1 " 

3 E ( >' “ **). 

i = 1 

“(2^) + 2^4 EE ■ 

/=1 


Necesitamos hallar el maximo de L (/jl, a 2 ) en el conjunto Q. = {(/a, cr 2 ) : /jl > /jl 0 , cr 2 > 0}. 
Observe que 

3L(pi, cr 2 )/3pi< 0, si /jl >y, 

3L(pi, <j 2 )/d/JL = 0, sipi=y, 

3L(pi, cr 2 )/d/JL > 0, si /x < y. 


Entonces, en el conjunto Q = {(pi, cr 2 ) : pi > pi 0 , cr 2 > 0}, In Z, (/a, cr 2 ) [y tambien L (pi, cr 2 )] 
se maximiza en pi donde 

I y, siy>pi 0 , 

Mo. siy<pi 0 . 

Al igual que antes, el valor de cr 2 en Q que maximiza L (/jl, cr 2 ), es 

o’ 2 = - X> ~ M) 2 - 

w u 

L(Cl) se obtiene al sustituir pi con pi y cr 2 con cr 2 , que da 


L(ft) = 



1/2 


exp 


-E 

i=1 


(yi ~ m) 2 

2<x 2 



n/2 


£ 


—n/2 
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Entonces, 


A = 


L{£2 0 ) (cr 


L(Cl) \d$ 


.2 \ ,! / 2 


E"=.(y/ ~y ) 2 

E"=i(y<- “Mo) 2 


nj 2 


i, 


si y > m o 


si y ^Mo- 


Observe que A es siempre menor que o igual a 1. Asf, valores “pequenos” de A son aquellos 
que son menores que k < 1. Porque 


;=i 


X)(y; - Mo) 2 = ^2 [(y,- - y) + (y - mo)] 2 
1=1 
n 

= ^(y; - y) 2 + n(y - Mo) 2 


i=l 


si k < 1, se deduce que la region de rechazo, A < k, es equivalente a 

e ?= i (* -y ) 2 


E"=i(y> - p-q ) 2 

Ek(y,- ~y ) 2 

E"=i(y«-~ y) 2 +«(y - p-o ) 2 

i 


i + 


n(y - Mo)" 

ET=i(y.- -y ) 2 

Esta desigualdad, a su vez, es equivalente a 

n(y-Mo) 2 . 1 


< k 2/n = k' 

< k' 

<k'. 


E”=i(y;-y ) 2 k ' 

n(y - Mo) 2 


> - -1 = k" 


1 " 

I](y‘ _ y> 2 

1=1 


> (n - 1 )k" 


n — 14 

i 

o bien, como y >/jl 0 cuando A < k < 1, 

Vn(y ~ mo) 


> V(n - l)Jt" 


donde 


5 2 = 


^X>-y) 2 - 

/=! 


Observe que y/n(Y — /jlq)/S es el estadfstico t empleado en secciones anteriores. En conse- 
cuencia, la prueba de razon de probabilidades es equivalente a la prueba t de la Seccion 10.8. 
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No son raras las situaciones en las que la prueba de razon de probabilidades toma una for¬ 
ma bien conocida. De hecho, todas las pruebas de las Secciones 10.8 y 10.9 se pueden obtener 
con el metodo de razon de probabilidades. Para casi todos los problemas practicos, el metodo 
de razon de probabilidades produce la mejor prueba posible en terminos de potencia. 

Desafortunadamente, el metodo de razon de probabilidades no siempre produce un estadfsti- 
co de prueba con distribucion de probabilidad conocida, por ejemplo el estadfstico t del Ejemplo 
10.24. Sin embargo, si el tamano muestral es grande, podemos obtener una aproximacion a la 
distribucion de A si algunas “condiciones de regularidad” razonables son satisfechas por la(s) 
distribucion(es) poblacional(es) basica(s). Estas son condiciones generales que se cumplen para 
la mayor parte (pero no todas) las distribuciones que hemos considerado. Las condiciones de 
regularidad comprenden basicamente la existencia de derivadas, con respecto a los parametros, 
de la funcion de probabilidad. Otra condition clave es que la region sobre la cual la funcion de 
probabilidad es positiva no puede depender de valores parametricos desconocidos. 


TEOREMA 1 0.2 Sean Y v Y 2 , . . . , Y n que tienen una funcion de probabilidad conjunta L(Q). Denotemos 
con r 0 el numero de parametros libres que estan especificados por H 0 : 0 E Q 0 y de¬ 
notemos con r el numero de parametros libres especificados por el enunciado 0 E £2. 
Entonces, para n grande, —2 ln(A) tiene aproximadamente una distribucion x 2 con r o — r 
grados de libertad. 


La prueba de este resultado esta fuera del proposito de este libro. El Teorema 10.2 nos per- 
mite usar la tabla de la distribucion \ 2 para determinar regiones de rechazo con a fija cuando 
n es grande. Observe que —2 ln(A) es una funcion decreciente de A. Como la prueba de razon 
de probabilidades especifica que usemos RR: {A < k}, este rechazo se puede reescribir como 
RR:{ — 2 Inf A) > — 2 Inf A) = k*}. Para tamanos muestrales grandes, si deseamos una prueba 
de nivel a, el Teorema 10.2 implica que k* ~ \ 2 . Esto es, una prueba de razon de probabili¬ 
dades para una muestra grande tiene la region de rechazo dada por 

-2 ln(A) > , donde esta basada en r 0 - r grados de libertad. 

El tamano de la muestra necesaria para una “buena” aproximacion varfa de una aplicacion a otra. 
Es importante darse cuenta que pruebas de razon de probabilidades para una muestra grande 
estan basadas en —2 ln(A), donde A es la razon de probabilidades original, A = L(Q 0 )/ L(Ci). 


EJ EMPLO 10.25 Suponga que un ingeniero desea comparar el numero de quejas por semana que los repre- 
sentantes del sindicato de dos turnos diferentes en una planta manufacturera registran por 
semana. Cien observaciones independientes del numero de quejas arrojo medias de x = 20 
por el turno 1 y y = 22 por el turno 2. Suponga que el numero de quejas por semana en el 
;-esimo turno tiene una distribucion de Poisson con media 0,. para i = 1,2. Use el metodo de 
razon de probabilidades para probar H 0 : 6 l = 0 1 contra H a \ 6 j A 0 2 con a ~ .01 . 

Solucion La probabilidad de la muestra es ahora la funcion de probabilidad conjunta de todas las x ; y 
las yj y esta dada por 

L{9i, 0 2 ) = (J^j0f Xi e~ n8l 9f yj e-" e2 , 

donde k = x { \ ■ ■ ■ x n \ yj- ■ ■ y n \ y n = 100. En este ejemplo, 0 = (9 V 0 2 ) y Q 0 = {(0,, 0 2 ): 
0 l = 0 2 = 9}, donde 9 es desconocida. Por tanto, dada H 0 la funcion de probabilidad es una 
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funcion del parametro individual 6 , y 

L(0) = (^jO Exi+ ' Ey ie- 2ne . 

Observe que, para 0 E Q 0 , L ( 6 ) se maximiza cuando 6 es igual a su estimacion de verosimi- 
litud maxima, 

En este ejemplo £2 fl = {( 61 , 62 ): 6 \ f 62 } y S2 = {(. 61 , 02 ) '61 > 0, 62 > 0}. Usando la pro- 
babilidad general L ( 6 X , 0 2 ). una funcion de 0 t y de 0 2 , vemos que L (0 h 0 2 ) se maximiza 
cuando §1 = x y 61 = y, respectivamente. Esto es, L ( 6 j, 0 2 ) se maximiza cuando 6 r y 0 2 
son sustituidas por sus estimaciones de maxima probabilidad. Entonces, 

_ L(Q 0 ) _ k~ x ( 6 T Jrnl e-' ln ^ _ ( 6 ) n * +n y 
L(Q) k~ 1 ( 0 i) n *( 02 ) n ye- nS> - n h (x) nx (y) n y' 

Observe que A es una funcion complicada de x y y. El valor observado de 6 es (1 /2)(x + 
y) = (1 /2)(20 + 22) = 21. El valor observado de A es 

2j(100)(20 +22) 

A _ 20(100)(20)22(100M22) 

y por tanto 

-2 ln(A) = —(2)[4200 ln(21) -20001n(20) -22001n(22)] = 9.53. 

En esta aplicacion, el numero de parametros libres en O = {( 61 , 62 ) '■ 6 \ > 0, 0 2 > 0} es 
k = 2. En £2o = {(^i,02) '- 6 \ = 0 2 = 6}, r 0 = 1 de estos parametros libres es fijo. En el con- 
junto £2, r = 0 de los parametros son fijos. El Teorema 10.2 implica que —2 ln(A) tiene una 
distribucion \ 2 aproximadamente con r 0 — r= 1—0 = 1 grado de libertad. Valores pequenos 
de A corresponden a grandes valores de — 2 ln(A), de modo que la region de rechazo para una 
prueba en aproximadamente el nivel a = .01 contiene los valores de —2 ln(A) que excedan 
de x oi = 6.635, el valor que corta un area de .01 en la cola derecha de una densidad \ 2 con 1 
grado de libertad. 

Como el valor observado de — 2 ln(A) es mayor que Xoi> rechazamos H 0 : 6 1 = 0 2 . 
Concluimos, en aproximadamente el nivel de significancia a = .01, que los numeros medios 
de quejas presentadas por los representantes del sindicato difieren. ■ 


Ejercicios 

10.105 Sea ij, V 2 , , Y n una muestra aleatoria de una distribucion normal con media /jl (desconocida) y 

varianza a 2 . Para probar H 0 :cr 2 = 0 ^ contra H a :cr 2 > c$, demuestre que la prueba de razon de proba- 
bilidades es equivalente a la prueba \ 2 dada en la Seccion 10.9. 

10.106 Una encuesta de la opinion de votantes fue realizada en cuatro delegaciones polfticas del centra de una 
ciudad para comparar la fraccion de votantes que estan a favor del candidato A. Muestras aleatorias de 
200 votantes se sondearon en cada una de las cuatro delegaciones, con los resultados que se muestran 
en la siguiente tabla. Los numeros de votantes que estan a favor de A en las cuatro muestras se pueden 
registrar como cuatro variables aleatorias binomiales independientes. 
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10.107 

10.108 

* 10.109 

* 10.110 

10.111 


Construya una prueba de razon de probabilidades de la hipotesis de que las fracciones de votantes que 
estan a favor del candidato A son iguales en las cuatro delegaciones. Use a = .05. 




Delegacion 



Opinion 

1 

2 

3 

4 

Total 

A favor de A 

76 

53 

59 

48 

236 

No a favor de A 

124 

147 

141 

152 

564 

Total 

200 

200 

200 

200 

800 


Sean S 2 y S|, respectivamente, las varianzas de muestras aleatorias independientes de tamanos n y 
m seleccionadas de distribuciones normales con medias gj y g 2 y varianza comun a 2 . Si gij y p 2 son 
desconocidas, construya una prueba de razon de probabilidad de H 0 : a 2 = oj contra H a :cr 2 — a 2 , 
suponiendo que a 2 > a 

Suponga que X p X 2 , . . . , X nj , Y v K,, . . . , Y n2 y W v W 2 , . . . , W son muestras aleatorias indepen¬ 
dientes de distribuciones normales con sus respectivas medias desconocidas gij, /r 2 y /r 3 y varianzas 

? 2 2 
0i.02. y °3- 

a Encuentre la prueba de razon de probabilidad para Hq : of = a 2 = a 2 contra la altemativa de al 
menos una desigualdad. 

b Encuentre una region crftica aproximada para la prueba del inciso a si n } , n 2 y n 3 son grandes y a = 
.05. 

Sea Xj, X„ . . . , X m una muestra aleatoria de la densidad exponencial con media 9 l y sea Y v Y 2 , . . . , Y n 
una muestra aleatoria independiente de una densidad exponencial con media d 2 . 

a Encuentre el criterio de razon de probabilidad para probar H 0 '. 6 2 = 9-, contra H a \9 x + 9-,. 
b Demuestre que la prueba del inciso a es equivalente a una prueba F exacta [Sugerencia: transforme 
EX.-yEi'j en variables aleatorias % 2 .] 

Demuestre que la prueba de razon de probabilidades depende de los datos solo a traves del valor de un 
estadistico suficiente. [ Sugerencia : use el criterio de factorizacion.] 

Suponga que estamos interesados en probar la hipotesis nula simple H 0 : 9 = 9 0 contra la hipotesis al- 
ternativa simple H a : 9 = 9 a . De acuerdo con el lema de Neyman—Pearson, la prueba que maximiza la 
potencia en 9 a tiene una region de rechazo determinada por 

H6o) ^ . 

- < k. 

L(9 a ) 


En el contexto de una prueba de razon de probabilidades, si estamos interesados en las hipotesis simples 
Hq y H a , como se expresa, entonces, £2o = {<9o}, ~ {9 a } y = {0o. 9 a }. 

a Demuestre que la razon de probabilidades A esta dada por 

A _ L(9 0 ) = 1 

max{L(9 0 ), L(9 a )} , f L(9 a ) \ 

1 L(9 0 ) J 

b Demuestre que A < k si y solo si, para alguna constante k', 

h^< k , 

L{9 a ) 

c implican los resultados de los incisos a y b acerca de las pruebas de razon de probabilidades 

cuando la hipotesis nula y la altemativa son simples? 
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10.112 


10.113 

* 10.114 


10.12 

En los Capftulos 8, 9 y 10 hemos presentado los conceptos basicos relacionados con dos meto- 
dos para hacer inferencias: estimacion y pruebas de hipotesis. Filosoficamente, la estimacion 
(Capltulos 8 y 9) se concentra en esta pregunta: yual es el valor numerico de un parametro 
0? En contraste, una prueba de una hipotesis trata de contestar esta pregunta: /.hay suficiente 
evidencia para apoyar la hipotesis alternativa? A menudo, el metodo inferential que se emplea 
para una situacion dada depende de como el experimentador prefiere expresar su inferencia. A 
veces esta decision se saca del bolsillo; es decir, la pregunta practica claramente implica que 
se use una estimacion o un procedimiento de hipotesis. Por ejemplo, la aceptacion o rechazo 
de los suministros entrantes o de los productos de salida en un proceso de manufactura clara¬ 
mente requiere una decision o una prueba estadfstica. Hemos visto que existe dualidad entre 
estos dos procedimientos de hacer inferencias. Un intervalo de confianza bilateral con coefi- 
ciente de confianza 1 — a puede verse como el conjunto de todos los valores de 0 O que son 
valores “aceptables” de hipotesis nula para 0 si usamos una prueba de nivel a bilateral. Del 
mismo modo, una prueba de nivel a de dos lados para H 0 : 6 = 6 0 se puede poner en practica 
al construir un intervalo de confianza bilateral (con coeficiente de confianza 1 — a) y rechazar 
H 0 si el valor 9 0 caefuera del intervalo de confianza. 

Asociadas con ambos metodos para hacer inferencias hay medidas de su bondad. Asf, el 
ancho esperado de un intervalo de confianza y el coeficiente de confianza miden la bondad 
del procedimiento de estimacion. Del mismo modo, la bondad de una prueba estadfstica es 
medida por las probabilidades a y (3 de cometer errores tipo I y tipo II. Estas medidas de 
bondad hacen posible que comparemos una prueba estadfstica con otra y desarrollemos una 
teorfa para adquirir pruebas estadfsticas con propiedades deseables. La capacidad de evaluar 
la bondad de una inferencia es una de las principales aportaciones de la estadfstica al analisis 
de datos experimentales. < Cual es el valor de una inferencia si no tenemos medida de su va- 
lidez? 

En este capftulo hemos investigado los elementos de una prueba estadfstica y explicado 
la forma en que trabaja una prueba. Algunas pruebas utiles se dan para demostrar como se 
pueden usar en situaciones practicas, ademas veremos otras interesantes aplicaciones en los 
siguientes capftulos. 

Muchos de los procedimientos de prueba desarrollados en este capftulo se presentaron 
desde un punto de vista intuitivo, pero tambien hemos ejemplificado el uso del lema de 
Neyman—Pearson para obtener procedimientos mas potentes para probar una hipotesis nula 
simple contra una hipotesis alternativa simple. Ademas, hemos visto la forma en que a veces 
se puede usar el metodo de Neyman—Pearson para hallar pruebas uniformemente mas poten- 


Suponga que muestras aleatorias independientes de tamanos n l y n 2 se han de seleccionar de pobla- 
ciones normales con medias /rj y /r,, respectivamente, y varianza comun cr 2 . Para probar H 0 : /rj = /r 2 
contra H a : fj, l — /r 2 > 0 (cr 2 desconocida), demuestre que la prueba de razon de probabilidades se reduce 
a la prueba t de dos muestras presentada en la Section 10.8. 

Consulte el Ejercicio 10.112. Demuestre que para la prueba de H 0 : fj, l = fjL 2 contra H a : ycq =£ /jl -> (cr 2 
desconocida) la prueba de razon de probabilidades se reduce a la prueba t de dos muestras. 

Consulte el Ejercicio 10.113. Suponga que otra muestra aleatoria independiente de tamano n 3 se selec- 
ciona de una tercera poblacion normal con media /r 3 y varianza cr 2 . Encuentre la prueba de razon de 
probabilidades para probar H 0 : /jl 1 = /r, = /x 3 contra la alternativa de que hay al menos una desigualdad. 
Demuestre que esta prueba es equivalente a una prueba F exacta. 


Resumen 
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tes para hipotesis compuestas nulas y alternativas si la distribution basica se especifica, ex- 
cepto por el valor de un parametro individual. La razon de probabilidades produce un metodo 
general para desarrollar una prueba estadfstica. Las pruebas de razon de verosimilitudes se 
pueden efectuar ya sea que existan o no parametros de ruido. En general, las pruebas de razon 
de probabilidades poseen propiedades deseables. Los procedimientos de Neyman—Pearson 
y de razon de verosimilitudes requieren que la distribution de la(s) poblacion(es) mostrada(s) 
sea conocida, excepto para los valores de algunos parametros. De otro modo, las funciones de 
probabilidad no pueden ser determinadas y los metodos no se pueden aplicar. 
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Ejercicios complementarios 

10.115 Verdadero o falso. 

a Si el valor p para una prueba es .036, la hipotesis nula puede ser rechazada en el nivel de significancia 
a = .05. 

b En una prueba formal de hipotesis, a es la probabilidad de que la hipotesis nula sea incorrecta. 
c Si el valor p es muy pequeno para una prueba que compara dos medias poblacionales, la diferencia 
entre las medias debe ser grande. 

d La potencia(fP) es la probabilidad de que la hipotesis nula sea rechazada cuando 6 = 6*. 
e La potencia(d) se calcula siempre suponiendo que la hipotesis nula es verdadera. 
f Si .01 < valor p < .025, la hipotesis nula siempre puede ser rechazada en el nivel de significancia 
a = . 02 . 

g Suponga que una prueba es una prueba nivel a uniformemente mas poderosa respecto al valor de 
un parametro d. Si d a es un valor en la hipotesis alternativa, /3 (d a ) podrta ser menor para alguna otra 
prueba nivel a. 

h Cuando se desarrolla una prueba de razon de probabilidad, es posible que L(f2 0 ) > L(f2). 
i — 2 ln(A) es siempre positivo. 

10.116 Consulte el Ejercicio 10.6. Encuentre la potenciafp), para p = .2, .3, .4, .5, .6, .7 y .8 y trace un dibujo 
aproximado de la funcion de potencia. 
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10.117 Lord Rayleigh fue uno de los primeros cientfficos en estudiar la densidad del nitrogeno. En sus estudios 
observo algo peculiar. Las densidades del nitrogeno producido a partir de compuestos quimicos tendian 
a ser menores que las densidades del nitrogeno producido del aire. Las mediciones de Lord Rayleigh 18 
se dan en la siguiente tabla. Estas mediciones corresponden a la masa de nitrogeno que llena un frasco 
de volumen especihcado a temperatura y presion especificadas. 


Compuesto quimico 

Atmosfera 

2.30143 

2.31017 

2.29890 

2.30986 

2.29816 

2.31010 

2.30182 

2.31001 

2.29869 

2.31024 

2.29940 

2.31010 

2.29849 

2.31028 

2.29889 

2.31163 

2.30074 

2.30956 

2.30054 



a Para las mediciones del compuesto quimico, y = 2.29971 y s = .001310; para las mediciones de la 
atmosfera, y = 2.310217 y s = .000574. ^Hay suficiente evidencia para indicar una diferencia en 
la masa media de nitrogeno por frasco para compuestos quimicos y el aire? ^Que se puede decir 
acerca del valor p asociado con su prueba? 

b Encuentre un intervalo de confianza de 95% para la diferencia en masa media de nitrogeno por frasco 
para compuestos quimicos y el aire. 

c Con base en su respuesta al inciso b, en el nivel de significancia a = .05, i,hay suficiente evidencia 
para indicar una diferencia en la masa media del nitrogeno por frasco para mediciones de compuestos 
quimicos y el aire? 

d i,Hay algun conflicto entre sus conclusiones en los incisos a y b? Aun cuando la diferencia en estas 
masas medias de nitrogeno es pequena. Lord Rayleigh destaco esta diferencia en lugar de pasarla por 
alto y esto llevo al descubrimiento de los gases inertes en la atmosfera. 

10.118 El efecto del consumo de alcohol parece ser mucho mayor a altitudes superiores. Para probar esta teorfa, 
un cientifico selecciono al azar 12 individuos y los dividio en dos grupos de 6 cada uno. Un grupo fue 
transportado a una altitud de 12,000 pies y cada miembro del grupo ingirio 100 centimetres cubicos 
(cm 3 ) de alcohol. Los miembros del segundo grupo fueron llevados al nivel del mar y recibieron la mis- 
ma cantidad de alcohol. Despues de dos horas, se midio la cantidad de alcohol en el torrente sanguineo 
de cada sujeto (mediciones en gramos/100 cm 3 ). Los datos aparecen en la siguiente tabla. ^Hay sufi¬ 
ciente evidencia para indicar que la retention de alcohol es mayor a 12,000 pies que al nivel del mar? 
Pruebe en el nivel de significancia a — .10. 


Nivel del mar 

12,000 pies 

.07 

.13 

.10 

.17 

.09 

.15 

.12 

.14 

.09 

.10 

.13 

.14 


18. Fuente : Proceedings, Royal Society (Londres) 55 (1894): 340—344. 
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10.119 


10.120 


10.121 


10.122 


En la actualidad, 20% de los clientes potenciales compran jabon de la marca A. Para incrementar ventas, 
la compama realizo una intensa campana de publicidad. A1 final de la campana, una muestra de 400 
clientes potenciales fue entrevistada para determinar si la campana tuvo exito. 

a Exprese H 0 y H a en terminos de p, la probabilidad de que un cliente prefiera el jabon de la marca A. 
b La compania decide concluir que la campana de publicidad fue un exito si al menos 92 de los 400 
clientes entrevistados preferia la marca A. Encuentre a. (Use la aproximacion normal a la distribu¬ 
tion binomial para evaluar la probabilidad deseada.) 

En el pasado, una planta quimica ha producido un promedio de 1100 libras de productos quimicos al dia. 
Los registros del ano pasado, con base en 260 dias de operation, muestran lo siguiente: 


y = 1060 libras/dia, s = 340 libras/dia. 

Deseamos probar si el promedio de produccion diaria bajo sensiblemente el ano pasado. 
a Formule las hipotesis nula y altemativa apropiadas. 

b Si se utiliza Z como estadistico de prueba, determine la region de rechazo correspondiente a un nivel 
de significancia de a = .05. 

c (,Los datos aportan suficiente evidencia para indicar una caida en el promedio de produccion diaria? 

Se compare la capacidad de frenado de dos tipos de automovil y se probaron muestras aleatorias de 64 
automoviles para cada tipo. Las mediciones registradas fueron las distancias requeridas para detenerse 
cuando se aplicaban los frenos a una velocidad de 40 millas por hora. Las medias muestrales y varianzas 
calculadas fueron las siguientes: 


118, 

y% = 

109, 

102, 

2 

S 2 ~ 

87. 


^Los datos aportan suficiente evidencia para indicar una diferencia en las distancias medias de parada de 
los dos tipos de automoviles? Determine el nivel de significancia alcanzado. 

La estabilidad de las mediciones de las caracterfsticas de un producto manufacturado es importante para 
mantener la calidad del mismo. De hecho, a veces es mejor obtener una pequena variation en el valor 
medido de alguna caracteristica importante de un producto y tener la media del proceso ligeramente 
fuera del objetivo, que obtener una amplia variation con un valor medio que se ajuste perfectamente a 
los requerimientos. Esta ultima situation puede producir un porcentaje mas alto de piezas defectuosas 
que la primera. Un fabricante sospechaba que una de sus lineas de produccion estaba produciendo 
focos con una alta variation en su duration. Para probar su teorfa, compare las duraciones de n = 50 focos 
muestreados al azar tornados de la linea sospechosa y n = 50 de una linea que parecia estar bajo control. 
Las medias muestrales y varianzas para las dos muestras fueron como se ve en la siguiente tabla. 


Linea sospechosa 

Linea bajo control 

y, = 1,520 

y 2 = 1,476 

.sf = 92,000 

si = 37,000 


a (,Los datos aportan suficiente evidencia para indicar que los focos producidos por la linea sospe¬ 
chosa poseen una duration mayor que los producidos por la linea que se supone esta bajo control? 
Use a = .05. 

b Encuentre el nivel aproximado de significancia observado para la prueba e interprete su valor. 
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10.123 Un fabricante de productos farmaceuticos compra un material particular a dos diferentes proveedores. El 
nivel medio de impurezas de la materia prima es aproximadamente igual para ambos proveedores, pero 
el fabricante esta preocupado por la variabilidad de las impurezas de un embarque a otro. Si el nivel de 
impurezas tiende a variar de manera excesiva para una fuente de suministro, podrra afectar la calidad del 
producto farmaceutico. Para comparar la variacion en el porcentaje de impurezas para los dos provee¬ 
dores, el fabricante selecciona diez embarques de cada uno de ellos y mide el porcentaje de impurezas 
de la materia prima para cada embarque. Las medias muestrales y varianzas se observan en la siguiente 
tabla. 


Proveedor A 

Proveedor B 

Ft = 1-89 

y 2 = 1.85 

sj = .273 

■sf = .094 

Hi =10 

«2 = 10 


a ^Los datos dan suficiente evidencia para indicar una diferencia en la variabilidad de los niveles de 
impureza de los embarques para los dos proveedores? Pruebe usando a = .10. Con base en los resul- 
tados de la prueba, ^que recomendacion harra usted al fabricante farmaceutico? 
b Encuentre un intervalo de confianza de 90% para e interprete sus resultados. 

10.124 Los datos de la siguiente tabla muestran lecturas en pies-libras de la resistencia al impacto de dos clases 
de material de empaque, tipo A y tipo B. Determine si la informacion sugiere una diferencia en la resis¬ 
tencia media entre las dos clases de material. Realice la prueba con un nivel de significancia a — .10. 


A 

B 

1.25 

.89 

1.16 

1.01 

1.33 

.97 

1.15 

.95 

1.23 

.94 

1.20 

1.02 

1.32 

.98 

1.28 

1.06 

1.21 

.98 

=11-13 

E^i =8-80 

y = 1.237 

y — .978 

Y,yf = 13.7973 

E yf = 8.6240 


10.125 ^Que eficiencia de combustion debe esperar el propietario de una casa de un homo de petroleo? La 
EPA indica que 80% o mas es excelente, 75% a 79% es buena, 70% a 74% es regular y debajo de 70% 
es mala. Un contratista de sistemas de calefaccion domestica, que vende dos marcas de calentadores 
de petroleo (llamemosles A y B) decidio comparar sus eficiencias medias al analizar las eficiencias de 
8 calentadores del tipo A y 6 del tipo B. Los porcentajes de eficiencia resultantes para los 14 calentado¬ 
res se muestran en la tabla siguiente. 
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Tipo A 

Tipo B 

72 

78 

78 

76 

73 

81 

69 

74 

75 

82 

74 

75 

69 


75 



a ^Los datos proporcionan suficiente evidencia para indicar una diferencia en las eficiencias medias 
para las dos marcas de calentadores domesticos? Encuentre el valor p aproximado para la prueba e 
interprete su valor. 

b Determine un intervalo de confianza de 90% para (/u A — p, B ) e interprete el resultado. 

10.126 Suponga que X\, X 3 , .X nx , Yi, L Y„ 2 , y WO, WO,.. ., W0 3 son muestras aleatorias indepen- 
dientes de distribuciones normales con sus respectivas medias desconocidas p, t , /u, 2 y /u 3 y varianzas 
comunes of = cr| = of = cr 2 .. Suponga que deseamos calcular una funcion lineal de las medias: 9 = 
a 1 pL 1 + a 2 /x 2 + a 3 p 3 . Debido a que el estimador de maxima verosimilitud (MLE) de una funcion de 
parametros es la funcion de los MLE de los parametros, el MLE de 9 es 9 = a\X + a 3 Y + a 3 W0 

a ^Cual es el error estandar del estimador 91 
b ^Cual es la distribucion del estimador 91 

c Si las varianzas muestrales estan dadas por S 2 , S? y Sf , respectivamente, considere 


(ki - 1)5 2 + (n 2 ~ 1)5; + (n 3 - l)Sf 
n\ + /i 2 + n 3 — 3 


i ^Cual es la distribucion de («] + n 2 + n 3 — 3)S^/crl 

ii ^,Cual es la distribucion de 


T = 


9-9 


2 2 0 
at at ax 

— + Yl + Jl 


n i 


n 2 n 3 


d De un intervalo de confianza para 9 con coeficiente de confianza 1 — a. 
e Desarrolle una prueba para H 0 : 9 = 9 0 contra H a : 9 # 9 0 . 

10.127 Un comerciante piensa que su utilidad semanal es una funcion de tres variables: ventas al menudeo (deno- 
tadas por X), ventas al mayoreo (denotadas por Y) y gastos generales (denotados por WO. Las variables X, Y 
y W son consideradas como variables aleatorias distribuidas normalmente, independientes, con medias p, t , 
H 2 ypL 3 y varianzas cr 2 , aa 2 y ba 2 , respectivamente, para constantes conocidas ay b, pero a 2 desconocida. 
La utilidad semanal esperada del comerciante es /L + /u 2 — /u 3 . Si el comerciante ha hecho observaciones 
independientes de X, Y y W durante las ultimas n semanas, construya una prueba de H 0 : /u,j + /u 2 — /jl 3 = 
k, contra la altemativa H a : pi l + /c 2 — /jl 3 # k, para una constante dada k. Puede especificar a = .05. 

10.128 Un examen de lectura se aplica a alumnos de sexto ano en tres grandes escuelas primarias. Se considera 
que las calificaciones del examen en cada escuela tienen distribuciones normales con medias descono¬ 
cidas jUj, p-, y pu 3 , respectivamente, y varianza comun desconocida o- 2 (cr 2 = of = of = cr 2 ). Usando 
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los datos de la tabla siguiente en muestras aleatorias independientes de cada escuela, pruebe si existe 
evidencia de una diferencia entre /jl 1 y /jl 2 . Use a = .05. 


Escuela I 

Escuela 11 

Escuela 111 

ri\ = 10 

n 2 = 10 

n 3 = 10 

£>, 2 = 36,950 

12 y? = 25,850 

=49,900 

O 

II 

\H 

y = 50 

w — 70 


*10.129 


Suponga que Y lt Y 2 , . . . , Y„ denotan una muestra aleatoria de la funcion de densidad de probabilidad 
dada por 


/(y |0i,02) 


( l~y~ (y ~ e2)/e \ y>02. 


o. 


en cualquier otro punto. 


Determine la prueba de razon de verosimilitudes para probar H 0 : 0 1 — d lQ contra H a : > 6 l0 con 0 2 
desconocida. 

*10.130 Consulte el Ejercicio 10.129. Encuentre la prueba de razon de verosimilitudes probando H 0 : d 2 = d 20 
contra H a : d 2 > d 20 con desconocida. 






CAPITULO 11 


Modelos lineales y estimacion 
por mfnimos cuadrados 


11.1 Introduccion 

11.2 Modelos estadfsticos lineales 

11.3 Metodo de mfnimos cuadrados 

11.4 Propiedades de los estimadores de mfnimos cuadrados: regresion lineal simple 

11.5 Inferencias respecto a los parametros /3, 

11.6 Inferencias respecto a funciones lineales de los parametros del modelo: regresion 
lineal simple 

11.7 Prediccion de un valor particular de Y mediante regresion lineal simple 

11.8 Correlacion 

11.9 Algunos ejemplos practicos 

11.10 Ajuste del modelo lineal mediante matrices 

11.11 Funciones lineales de los parametros del modelo: regresion lineal multiple 

11.12 Inferencias respecto a funciones lineales de los parametros del modelo: regresion 
lineal multiple 

11.13 Prediccion de un valor particular de Y mediante regresion multiple 

11.14 Una prueba para H 0 : /3 g+1 = j3 g+1 = • • • = f3 k = 0 

11.15 Resumen y conclusiones 
Bibliograffa y lecturas adicionales 


563 




564 


Capftulo 11 Modelos lineales y estimacion por mfnimos cuadrados 


11.1 Introduccion 

En el Capftulo 9 consideramos varios metodos para hallar estimadores de parametros, inclu- 
yendo los metodos de momentos y maxima probabilidad, asf como los basados en estadfsticos 
suficientes. Otro metodo de estimacion, el de mfnimos cuadrados, es el tema de este capftu¬ 
lo. 

En todas nuestras explicaciones anteriores acerca de la inferencia estadfstica supusimos 
que las variables aleatorias Ej, Y 2 , . . . , Y n , eran independientes y distribuidas identicamente. 
Una implication de esta suposicion es que el valor esperado de Y t , E(Y |), es constante (si 
existe). Esto es, E(Yi) = p. no depende del valor de ninguna otra variable. Obviamente, esta 
suposicion no es valida en muchos problemas inferenciales. Por ejemplo, la distancia media 
de frenado para cierto tipo de automovil dependera de la rapidez a la que el automovil se este 
moviendo; la potencia media de un antibiotico depende del tiempo que este hay a estado al- 
macenado; la cantidad media de alargamiento observada en una aleacion de metal depende de 
la fuerza aplicada y la temperatura de la aleacion. En este capftulo emprendemos un estudio 
de procedimientos inferenciales que se pueden usar cuando una variable aleatoria Y, llamada 
variable dependiente, tiene una media que es funcion de una o mas variables no aleatorias x t , 
x 2 ,, x k , llamadas variables independientes. (En este contexto, los terminos independiente y 
dependiente se usan en su sentido matematico. No hay relation con el concepto probabilfstico 
de variables aleatorias independientes.) 

Muchos tipos diferentes de funciones matematicas se pueden usar para modelar una res- 
puesta que sea una funcion de una o mas variables independientes. Estas se pueden clasificar 
en dos categorfas: modelos determinfsticos y probabilfsticos. Por ejemplo, suponga que yyx 
estan relacionadas de acuerdo con la ecuacion 

y = Pa + /V- 

donde /3 0 y /3, son parametros desconocidos. Este modelo se llama modelo matematico deter- 
mimstico porque no toma en cuenta ningun error para predecir o pronosticar y como funcion 
de x. Este modelo implica que v siempre tome el valor (3 0 + /S 1 (5.5) siempre que x = 5.5. 

Suponga que recolectamos una muestra de n valores de y correspondientes a n ajustes 
diferentes de la variable independiente x y que una grafica de los datos es como se ilustra 
en la Figura 11.1. Esta claro en la figura que el valor esperado de Y puede aumentar como 
funcion lineal de x, pero un modelo determinfstico esta lejos de una descripcion adecuada de 


FIGURA 11.1 r 
Grafica de datos 

300 

200 

100 
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la realidad. Experimentos repetidos cuando x = 5.5 darfan valores de Y que variaran de ma- 
nera aleatoria, lo cual nos dice que el modelo determim'stico no es una representacion exacta 
de la relation entre las dos variables. Ademas, si el modelo se usara para predecir Y cuando 
x = 5.5, la prediccion estarfa sujeta a algun error desconocido y esto, por supuesto, nos lleva 
al uso de metodos estadfsticos. Predecir Y para un valor dado de x es un proceso inferencial. 
Si la prediccion ha de ser de utilidad en la vida real, es necesario que estemos en posibilidad 
de evaluar la verosimilitud de observar errores de prediccion de varias magnitudes. 

En contraste con el modelo determimstico, los expertos en estadfstica usan modelos pro- 
babilisticos. Por ejemplo, podrfamos representar las respuestas de la Figura 11.1 por medio 
del modelo 


E(Y) = [3 0 + jSjJt 


o bien, lo que es equivalente, 


Y = (3 0 + [3 l x + e 

donde e es una variable aleatoria que tiene una distribucion de probabilidad espetifica con 
media 0. Consideremos a Y como la suma de un componente determimstico E(Y) y un compo- 
nente aleatorio e. Este modelo toma en cuenta el comportamiento aleatorio de Y exhibido en 
la Figura 11.1 y da una descripcion mas precisa de la realidad que el modelo determimstico. 
Ademas, las propiedades del error de prediccion para Y se pueden obtener en muchos de los 
modelos probabilfsticos. 

La Figura 11.2 muestra una representacion grafica del modelo probabilfstico Y = (3 0 + 
/3;jc + e. Cuando x = 5.5, hay una poblacion de posibles valores de Y. La distribucion de esta 
poblacion esta indicada en la parte principal de la grafica y esta centrada en la recta E(Y) = 
(3 0 + PyX en el punto x = 5.5. Esta poblacion tiene una distribucion con media [3 (} + /3,f5.5) y 
varianza cr 2 , como se muestra en la version amplificada de la distribucion que esta encerrada 


FIGURA 11.2 
Grafica del modelo 
probabilfstico 

Y = Po + P\ x + £ 
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en el recuadro de la Figura 11.2. Cuando x = 7, hay otra poblacion de posibles valores de Y. 
La distribucion de esta poblacion tiene la misma forma que la distribucion de valores Y cuan¬ 
do x = 5.5 y tiene la misma varianza <r 2 , pero cuando x = 7, la distribucion de Y tiene media 
/3 0 + /3j(7). Lo mismo se cumple para cada posible valor de la variable independiente x. Esto 
es, en un modelo de regresion, existe una poblacion separada de valores de respuesta para 
cada posible ajuste de la(s) variable(s) independiente(s). Todas estas poblaciones tienen la 
misma varianza y la forma de las distribuciones de las poblaciones son iguales (vease 
la Figura 11.2); no obstante, la media de cada poblacion depende, mediante el modelo de 
regresion, del ajuste de la(s) variable(s) independiente(s). Existen textos cientibcos y mate- 
maticos llenos de modelos determimsticos de la realidad. De hecho, muchas de las funciones 
matematicas que aparecen en libros de calculo y fisica son modelos matematicos determims¬ 
ticos de la naturaleza. Por ejemplo, la ley de Newton que relaciona la fuerza de un cuerpo en 
movimiento con su masa y aceleracion, 


F = ina, 

es un modelo determimstico que, para fines practicos, predice con poco error. En contraste, 
otros modelos —por ejemplo las funciones representadas graficamente en publicaciones y 
textos cientificos— con frecuencia son deficientes. Se ha restado enfasis a la dispersion de 
puntos que darian evidencia grafica de sus inadecuaciones, semejantes al comportamiento 
aleatorio de los puntos de la Figura 11.1, lo cual lleva a los cientificos novatos a aceptar las 
correspondientes “leyes” y teorias como una descripcion exacta de la naturaleza. 

Si se pueden usar modelos determimsticos para predecir con error insignificante, para to- 
dos los fines practicos, los usamos. Si no es asi, buscamos un modelo probabilistico que no 
sera una caracterizacion exacta de la naturaleza pero que hace posible evaluar la validez de 
nuestras inferencias. 


11.2 Modelos estadfsticos lineales 

Aun cuando se puede usar un numero infinito de funciones diferentes para modelar el valor 
medio de la variable de respuesta Y como funcion de una o mas variables independientes, nos 
concentraremos en un conjunto de modelos llamados modelos estadfsticos lineales. Si Y es la 
variable de respuesta y x es una sola variable independiente, puede ser razonable en algunas 
situaciones usar el modelo E{Y)= ft 0 + ft pc para los valores desconocidos de parametros ft 0 
y ft [. Observe que, en este modelo, E(Y) es una funcion lineal de x (para ft 0 y ft l dadas) y 
tambien una funcion lineal de ft 0 y ft l [porque E(Y)= cft 0 + dft t con c = 1 y d = x]. En el 
modelo E(Y)= ft 0 + ft pc 2 , E(Y) no es una funcion lineal de x, pero es una funcion lineal de ft 0 
y ft l [porque E(Y)= cft 0 + dft 1 con c = 1 y d = x 2 ]. Cuando decimos que tenemos un modelo 
estadistico lineal para Y, queremos decir que E( Y) es una funcion lineal de los parametros 
desconocidos ft 0 y ft l y no necesariamente una funcion lineal de x. Entonces, Y = ft 0 + ft l 
(In x) + e es un modelo lineal (porque In x toma valores conocidos para cada valor fijo de x). 

Si el modelo relaciona E(Y) como una funcion lineal de ft () y /3 unicamente, el modelo 
recibe el nombre de modelo de regresion lineal simple. Si mas de una variable independiente, 
por ejemplo x u x n ,. . ., x k , son de interes y modelamos E(Y) con 


E{Y) — fto + ftixi + ■ ■ ■ + ft k x k . 
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FIGURA 11.3 

Grafica de E(Y) = 

Po + P\ x \ Pl X 2 



el modelo se denomina modelo de regresion lineal multiple. Como x u x 2 , . . . , x k son consi- 
deradas como variables con valores conocidos, se supone que estan medidas sin error en un 
experimento. Por ejemplo, si listed piensa que el rendimiento medio E(Y) es una funcion de 
la variable t , la temperatura de un proceso qufmico, podrfa hacer x l = t y x 2 = e' y usar el 
modelo E(Y) = /3 0 + f3 l x l + P 2 x 2 o bien, de manera equivalente E(Y) = /3 0 + [3 { t + [3 2 e‘. O 
bien, si E(Y) es una funcion de dos variables x, y x 2 , podria escoger una aproximacion plana 
a la verdadera respuesta media usando el modelo lineal E(Y) = /3o + [i\x\ + 182 x 2 . Entonces, 
E(Y) es una funcion lineal de /3 0 , /Sj y yS 2 y representa un piano en el espacio y, x ; , x 2 (vea la 
Figura 11.3). Del mismo modo, 


E(Y) = (3 0 + frx + p 2 x 2 


es un modelo estadfstico lineal, donde E(Y) es una funcion con polinomios de segundo orden 
de la variable independiente x, con x x = x y x 2 = x~. Este modelo serfa apropiado para una 
respuesta que traza un segmento de una parabola sobre la region experimental. 

El porcentaje de agua esperado E ( Y) que contiene el papel durante su manufactura podria 
estar representado por una funcion de segundo orden de la temperatura del secador, x x , y la 
rapidez de la maquina que fabrica el papel, x 2 . Entonces, 


E(Y) — fio + /3iXi + /3 2 X2 + fhx\x 2 + ^4 x\ + fax 2 , 


donde /3 0 , f3 t , .... f3 5 son parametros desconocidos en el modelo. Geometricamente, E(Y) 
describe una superficie (conica) de segundo orden sobre el piano x v x 2 (vea la Figura 11.4). 
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FIGURA 11.4 

Grafica de E(Y) = 
Po + Pl-Xl + P2X2 + 
( 83 X 1*2 + P*x~ + Psx 2 



DEFINICION 11.1 

Un modelo estadistico lineal que relaciona una respuesta aleatoria Y con un conjunto de 
variables independientes x 1 ? x 2 ,..., x k es de la forma 



Y = A) + /3ixi + p 2 xi -1-+ PkXk + e, 


donde f3 0 , (3 U . . 
variables X[,x 2 ,.. 
que 

. , (3 k son parametros desconocidos, e es una variable aleatoria y las 
. ,x k toman valores conocidos. Supondremos que E(e) = 0 y por tanto 



E(Y) = fa + P 1 X 1 + P 2 X 2 + • ■ ■ + (3kXk■ 


Consideremos la interpretation ffsica del modelo lineal Y. Decimos que Y es igual a un 
valor esperado /3 0 + /3 l x 1 + f3 2 x 2 + • • • + f3 k x k (una funcion de las variables independientes 
x u x 2 ,..., x k ), mas un error aleatorio e. Desde un punto de vista practico, e reconoce nuestra 
incapacidad para dar un modelo exacto por naturaleza. En experimentation repetida, Y vatia 
alrededor de E(Y) de un modo aleatorio porque no hemos incluido en nuestro modelo toda la 
gran cantidad de variables que pueden afectar a Y. Por fortuna, muchas veces el efecto neto de 
estas variables no medidas y con mucha frecuencia desconocidas, es hacer que Y varfe de ma- 
nera que puedan ser aproximadas adecuadamente mediante una suposicion de comportamien- 
to aleatorio. 

En este capftulo usamos el metodo de mmimos cuadrados para obtener estimadores para los 
parametros /3 0 , [3 t ,..., (3 k en un modelo de regresion lineal. En muchas aplicaciones uno o mas de 
estos parametros tendran interpretaciones significativas, razon por la cual desarrollamos metodos 
inferenciales para un parametro /3 individual y para conjuntos de parametros ( 6 . Si estimamos los 
parametros /S 0 , f3 { ,..., /3 5 del modelo que expresa el porcentaje esperado E ( Y) de agua en papel 
como polinomio de segundo orden en x, (la temperatura del secador) y x 2 (la rapidez del secador), 
podremos desarrollar metodos para estimar y formar intervalos de confianza para el valor de E( Y) 
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cuando x t y x 2 tomen valores especificos. Del mismo modo, podemos desarrollar metodos 
para predecir un valor futuro de Y cuando las variables independientes tomen valores de inte¬ 
rns practico. Las Secciones 11.3 a 11.9 se concentran en el modelo de regresion lineal simple, 
mientras que las ultimas secciones se refieren a modelos de regresion lineal multiple. 


11.3 Metodo de mmimos cuadrados 

Un procedimiento para estimar los parametros de cualquier modelo lineal, el metodo de mmi¬ 
mos cuadrados, se puede ilustrar con solo ajustar una recta a un conjunto de puntos. Suponga 
que deseamos ajustar el modelo 


E(Y) = [3 0 + /V 

al conjunto de puntos que se muestra en la Figura 11.5. [La variable independiente x podrfa 
ser w 2 o (w ) 1 ' 2 o In w, etc., para alguna otra variable independiente w.] Esto es, postulamos 
que Y= p 0 + Ppc + e, donde e tiene alguna distribution de probabilidad con E(e) = 0. Si 
/So y son estimadores de los parametros p o y P h entonces Y = Po + 0\X es claramente un 
estimador de E(Y). 

El procedimiento de mmimos cuadrados para ajustar una recta que pase por un conjun¬ 
to de n puntos es semejante al metodo que podrfamos usar si ajustamos una recta a simple 
vista; esto es, deseamos que las diferencias entre los valores observados y los puntos corres- 
pondientes en la recta ajustada sean “pequenas” en un sentido general. Una forma comoda 
de lograr esto y que proporciona estimadores con buenas propiedades, es minimizar la su- 
ma de cuadrados de las desviaciones verticales a partir de la recta ajustada (vea las desviacio- 
nes indicadas en la Figura 11.5). Entonces, si 

5 ’i = Po + P\Xi 

es el valor pronosticado del i-esimo valor y (cuando x = x,), entonces la desviacion (a veces 
llamada error) del valor observado de _y ( a partir de y, = Po + (i i x, es la diferencia y,- — y, y 
la suma de los cuadrados de las desviaciones a minimizar es 

n n 

sse = - y,) z = - <&>+ 

1=1 1=1 


FIGURA 11.5 
Ajuste de una 
recta que pasa 
por un conjunto 
de puntos 


y 


Yi 


Yi 
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La cantidad SSE tambien recibe el nombre de suma de cuadrados del error por razones que 
mas adelante se haran evidentes. 

Si la SSE tiene un imnimo, ocurrira para valores de f3 0 y que satisfagan las ecuaciones, 
dSSE/d/3 ( | = 0 y dSSE/5/3, = 0. Tomando las derivadas parciales de la SSE con respecto a 
/3 q y Pi e igualando a cero, obtenemos 


y 


assE = a{E"=i[y/ -(/3 q + /3i^)] 2 } 

dPo dp 0 


~ (/3o +PiX i)] 

i=1 


= “2 f^y; - nfio - Pi 


= 0 


dSSE = 3{E?=i[y/ - (A) +j8i-r,-)] 2 } 
3)8 1 dp i 


n 

~ y. 2[>’i -()8o +/3ix,)]x,- 
i=i 


= -9 V 


jc/y,- 




i i = l 


1=1 



= 0 . 


Las ecuaciones 9SSE/)3o =0 y r)SSE//3 1 =0 se denominau ecuaciones de mfnimos cuadra- 
dos para estimar los parametros de una recta. 

Las ecuaciones de mlnimos cuadrados son lineales en /Li y (3 \ y por tanto pueden resolver- 
se simultaneamente. Usted puede verificar que las soluciones son 


7> - x)(y t - y) 


y^( x i - xf 

i=1 

/3 0 = y-$ix. 


n inn 



Ademas, se puede demostrar que la solucion simultanea para las dos ecuaciones de minimos 
cuadrados da valores de p 0 y p t que minimizan la SSE. Dejamos esto para que lo comprue- 
be. 

Las expresiones 


n 

“ x)(yi - y) y 

i=1 


y^jxj - x) 2 

i=i 


que se usan para calcular pi se encuentran a menudo en el desarrollo de modelos de regresion 
lineal simple. La primera de estas se calcula al sumar productos de valores x menos su media 
y valores y menos su media. En todas nuestras exposiciones siguientes denotaremos esta can¬ 
tidad por S xy . Del mismo modo, denotaremos la segunda cantidad por S xx porque se calcula al 
sumar productos que contienen unicamente los valores x. 
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Estimadores de mmimos cuadrados para el modelo de regresion lineal simple 

1- Pi = y 1 , donde S xy = ^(x, -x)(y l -y) y S xx = £" = |(x, ~x) 2 . 

^ xx „ i'=i 

2 . p 0 = y- fax. 


Ilustramos el uso de las ecuaciones anteriores con un ejemplo sencillo. 


EJEMPLO 11.1 Use el metodo de mmimos cuadrados para ajustar una recta a los n = 5 puntos de datos dados 
en laTabla 11.1 


Tablall.1 Datos para el Ejemplo 11.1 


X 

y 

-2 

0 

-1 

0 

0 

l 

1 

l 

2 

3 


Solucion Comenzamos el calculo de las estimaciones de mmimos cuadrados para la pendiente y puntos 
de interseccion de la recta ajustada construyendo la Tabla 11.2. Usando los resultados de la 
tabla obtenemos 



Po = y - P\X = - ~ (.7)(0) = 1, 


7 - |(0)(5) 
10 - ^( 0) 2 


y la recta ajustada es 


y = 1 + .lx. 


Tabla 11.2 Calculos para determinar los coeficientes 


Xi 

yi 

XiJ; 

x? 

-2 

0 

0 

4 

-1 

0 

0 

1 

0 

l 

0 

0 

1 

l 

1 

1 

2 

3 

6 

4 

e:=,x, =o 

Y2U >'« =5 

£?=!*.• =7 

o 

II 

w 
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Los cinco puntos y la recta ajustada se muestran en la Figura 


11 . 6 . 


En esta seccion, hemos determinado los estimadores de mmimos cuadrados para los para- 
metros [3 (} y /3[ del modelo E(Y) = (3 0 + /3 l x. El sencillo ejemplo empleado aquf reaparecera 
en futuras secciones para ilustrar otros calculos. Ejercicios de naturaleza mas realista se pre- 
sentan al final de las secciones y se analizan dos ejemplos que comprenden datos provenientes 
de experimentos reales en la Seccion 11.9. En la siguiente seccion desarrollamos las propie- 
dades estadfsticas de los estimadores de mmimos cuadrados /3o y $ i. Secciones subsiguientes 
estan dedicadas a usar estos estimadores para varios fines inferenciales. 


Ejercicios 

11.1 Si /6o y /8i son las estimaciones de mmimos cuadrados para la ordenada al origen y la pendiente en un 
modelo de regresion lineal sencilla, demuestre que la ecuacion de mmimos cuadrados y = p 0 + f3 { x 
siempre pasa por el punto (J, y). [Sugerencia: sustituya x por x en la ecuacion de mmimos cuadrados y 
use el hecho de que 0 O = y — 0iX.\ 

11.2 Ejercicio Applet ,,Cdmo puede usted mejorar su comprension de como trabaja realmente el metodo de 
mmimos cuadrados? Entre a la aplicacion Fitting a Line Using Least Squares (en www.thomsonedu. 
com/statistics/wackerly). Los datos que aparecen en la primera grafica son del Ejemplo 11.1. 

a ^Cuales son la pendiente y la ordenada al origen de la recta horizontal azul? (Vea la ecuacion sobre la 
grafica.) ^,Cual es la suma de los cuadrados de las desviaciones verticales entre los puntos sobre 
la recta horizontal y los valores observados de las y? ^,La recta horizontal se ajusta bien a los da¬ 
tos? Haga clic en el boton “Display/Hide Error Squares”. Observe que las areas de los recuadros 
amarillos son iguales a los cuadrados de las desviaciones asociadas. ^Como se compara la Suma de 
Cuadrados de los Errores (SSE) con la suma de las areas de los recuadros amarillos? 
b Haga clic en el boton “Display/Hide Error Squares” para que desaparezcan los recuadros amarillos. 
Ponga el cursor en el extremo derecho de la recta azul. Haga clic y mantenga presionado el boton 
del mouse y arrastre la recta para que la pendiente de la recta azul se haga negativa. ^Que observa 
acerca de las longitudes de las rectas verticales rojas? ^La SSE aumenta o disminuye? ^La recta con 
pendiente negativa parece ajustar bien los datos? 

c Arrastre la recta para que la pendiente sea cercana a 0.8. ^Que ocurre cuando se acerca la pendiente a 
0.7? ^La SSE aumenta o disminuye? Cuando la recta azul se mueve en realidad esta haciendo pivote 
alrededor de un punto fijo. ^Cuales son las coordenadas de ese punto pivote? ^Las coordenadas del 
punto pivote son consistentes con el resultado que obtuvo en el Ejercicio 11.1? 
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d Arrastre la recta azul hasta que obtenga una recta que visualmente se ajuste bien a los datos. ^Cuales 
son la pendiente y la ordenada al origen de la recta que visualmente se ajusta a los datos? ^Cual es el 
valor de la SSE para la recta que visualmente se ajusto a los datos? Haga clic en el boton “Find Best 
Model” para obtener la recta de mmimos cuadrados. ^Como se compara el valor de la SSE con la 
SSE asociada con la recta que usted visualmente ajusto a los datos? ^Como se comparan la pendiente 
y la ordenada al origen de la recta que usted visualmente ajusto a los datos con la pendiente y la 
ordenada al origen de la recta de minimos cuadrados? 

11.3 Ajuste una recta a los cinco puntos de la tabla siguiente. De las estimaciones de /3 0 y /3j. Localice los 
puntos y trace la recta ajustada como prueba de los calculos. 


7 

3.0 

2.0 

1.0 

1.0 

0.5 

X 

-2.0 

-1.0 

0.0 

1.0 

2.0 


11.4 Es frecuente que a los auditores se les exija comparar el valor auditado (o de lista) de un articulo de 
inventario contra el valor en libros. Si una empresa esta llevando su inventario y libros actualizados, de- 
beria haber una fuerte relation lineal entre los valores auditados y en libros. Una empresa muestreo diez 
articulos de inventario y obtuvo los valores auditado y en libros que se dan en la tabla siguiente. Ajuste 
el modelo Y = /3 0 + j3 x x + e a estos datos. 


Articulo Valor auditado (yi) Valor en libros (x;) 


1 

9 

10 

2 

14 

12 

3 

7 

9 

4 

29 

27 

5 

45 

47 

6 

109 

112 

7 

40 

36 

8 

238 

241 

9 

60 

59 

10 

170 

167 


a ^Cual es su estimation para el cambio esperado en valor auditado para un cambio de una unidad en 
el valor en libros? 

b Si el valor en libros es x = 100, ^que usaria para estimar el valor auditado? 

11.5 iQue aspecto tenian los precios de vivienda en los “buenos y viejos tiempos”? La mediana de los precios 
de venta para casas nuevas unifamiliares se dan en la tabla siguiente, para los anos 1972 a 1979. 1 Si con Y 
denotamos la mediana de los precios de venta y con .t el ano (usando enteros 1,2,.... 8), ajuste el modelo 
Y = j8 0 + j3 l x + £. iQue se puede concluir de los resultados? 


Ano 

Mediana de los precios 
de venta (X10001 

1972 (1) 

$27.6 

1973 (2) 

$32.5 

1974 (3) 

$35.9 

1975 (4) 

$39.3 

1976 (5) 

$44.2 

1977 (6) 

$48.8 

1978 (7) 

$55.7 

1979 (8) 

$62.9 


1. Fuente: adaptado de Time , 23 de julio de 1979, p. 67. 
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11.6 Ejercicio Applet Consulte los Ejercicios 11.2 y 11.5. Los datos del Ejercicio 11.5 aparecen en la grafica 
bajo el encabezado “Another Example” en la aplicacion Fitting a Line Using Least Squares. De nuevo, 
la recta azul horizontal que inicialmente aparece en la grafica es una recta con pendiente 0. 

a ^Cual es la ordenada al origen de la recta con pendiente 0? ^Cual es el valor de la SSE para la recta 
con pendiente 0? 

b ^Piensa usted que una recta con pendiente negativa se ajustara bien a los datos? Si la recta es arras- 
trada para producir una pendiente negativa, ^la SSE aumenta o disminuye? 
c Arrastre la recta para obtener una lrnea que visualmente se ajuste bien a los datos. ^Cual es la ecua- 
cion de la recta que obtuvo? ^Cual es el valor de la SSE? r,Que le ocurre a la SSE si la pendiente (y 
la ordenada al origen) de la recta se cambia desde la que usted ajusta visualmente? 
d La recta que usted ajusta visualmente, ^es la recta de mmimos cuadrados? Haga clic en el boton 
“Find Best Model” para obtener la recta con la SSE mas pequena. ^.Corno se comparan la pendiente 
y la ordenada al origen de la recta de mmimos cuadrados con la pendiente y la ordenada al origen de 
la recta que usted visualmente ajusto en el inciso c? ^Como se comparan las sumas de cuadrados del 
error (SSE)? 

e Consulte el inciso a. ^Cual es la coordenada y del punto alrededor del cual gira la recta azul? 
f Haga clic en el boton “Display/Hide Error Squares”. (,Que observa usted sobre el tamano de los 
recuadros amarillos que aparecen en la grafica? ^Cual es la suma de las areas de los recuadros ama- 
rillos? 

11.7 Ejercicio Applet Mueva la parte de la aplicacion marcada como “Curvilinear Relationship” asociada 
con la aplicacion Fitting a Line Using Least Squares. 

a ),Le parece que una recta dara un buen ajuste a los datos en la grafica? ^Parece que es probable que 
hay a alguna relation funcional entre E(Y)y xl 
b (,Hay alguna recta que se ajuste mejor a los datos que aquella con pendiente 0? 
c Si usted ajusta una recta a un conjunto de datos y obtiene que la recta de mejor ajuste tiene pendiente 
0, ^significa eso que no hay relation funcional entre E(Y) y la variable independiente? ^Por que? 

11.8 Experimentos de laboratorio disenados para medir valores de la LC50 (concentration letal que mata 
50% de la especie a prueba), para el efecto de ciertos toxicos en peces, son realizados siguiendo dos 
metodos. Uno consiste en circular agua continuamente por tanques de laboratorio y el otro mantiene 
agua en condiciones estaticas. Con el fin de establecer criterios de toxicos, la Environmental Protection 
Agency (EPA) desea ajustar todos los resultados a la condition de circulation. Entonces, se hace necesa- 
rio un rnodelo para relacionar los dos tipos de observaciones. Las observaciones de toxicos examinados 
en condiciones estatica y de flujo dieron los datos de la tabla siguiente (mediciones en partes por millon, 
ppm). Ajuste el modelo Y = fi 0 + /3 1 x + s. 


Toxico 

Flujo de la LC50 (v) 

LC50 estatica (x) 

1 

23.00 

39.00 

2 

22.30 

37.50 

3 

9.40 

22.20 

4 

9.70 

17.50 

5 

.15 

.64 

6 

.28 

.45 

7 

.75 

2.62 

8 

.51 

2.36 

9 

28.00 

32.00 

10 

.39 

.77 


a ^Que interpretation se puede dar a los resultados? 

b Estime el valor de circulation para un toxico con un valor de LC50 estatico de x = 12 ppm. 
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11.9 En la siguiente tabla aparece information acerca de ocho automoviles de cuatro cilindros considerados 
entre los mas eficientes en consumo de combustible en 2006. Los tamanos de los motores se dan en 
volumen total de cilindros, medido en litros (L). 


Automovil 

Volumen de cilindros ( x ) 

Caballos de 
potencia (y) 

Honda Civic 

1.8 

51 

Toyota Prius 

1.5 

51 

VW Golf 

2.0 

115 

VW Beetle 

2.5 

150 

Toyota Corolla 

1.8 

126 

VW Jetta 

2.5 

150 

Mini Cooper 

1.6 

118 

Toyota Yaris 

1.5 

106 


a Localice los puntos en papel milimetrico. 


b Encuentre la recta de mrnimos cuadrados para los datos. 

c Grafique la recta de mrnimos cuadrados para ver lo bien que se ajusta a los datos. 

d Use la recta de mrnimos cuadrados para estimar la clasificacion media de potencia para un automovil 
eficiente en uso de combustible con volumen de cilindros de 1.9 L. 

11.10 Suponga que hemos postulado el modelo 

Yi = fax, + e, i= 1 , 2 ,..., n, 

donde las e, son variables aleatorias independientes y distribuidas identicamente con Efaf) = 0. Entonces 
y, = fax, es el valor pronosticado de y cuando x = x, y SSE = 5Z” =1 [y,- — fax,} 2 . Encuentre el estima- 
dor de mrnimos cuadrados de (3 V (Observe que la ecuacion y = fix describe una recta que pasa por el 
origen. A rnenudo el modelo que acabamos de describir se denomina modelo sin puntos de cruce.) 

11.11 Algunos datos obtenidos por C. E. Marcellari 2 sobre la altura x y diametro y de caparazones de tortuga 
aparecen en la tabla siguiente. Si consideramos el modelo 

E(Y) = fax, 

entonces la pendiente (3, es la razon entre el diametro medio y la altura. Use el resultado del Ejercicio 
11.10 y los datos siguientes para obtener la estimation de mrnimos cuadrados de la relation entre el 
diametro medio y la altura. 


Especimen 

Diametro (y) 

Altura (x) 

OSU36651 

185 

78 

OSU 36652 

194 

65 

OSU 36653 

173 

77 

OSU 36654 

200 

76 

OSU 36655 

179 

72 

OSU 36656 

213 

76 

OSU 36657 

134 

75 

OSU 36658 

191 

77 

OSU 36659 

177 

69 

OSU 36660 

199 

65 


2. Fuente: Carlos E. Marcellari, “Revision of Serpulids of the Genus Rotularia (Annelida) at Seymour Island (An¬ 
tarctic Peninsula) and Their Value in Stratigraphy," Journal of Paleontology 58(4) (1984). 
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11.12 Por lo general las procesadoras de alimentos preservan los pepinos fermentandolos en una salmuera 
baja en sales (6% a 9% de cloruro de sodio) y luego almacenandolos en una salmuera de alto contenido 
de sales hasta que son utilizados para producir varios tipos de pepinillos en vinagre. La salmuera alta 
en sales es necesaria para retardar el suavizamiento de los pepinillos y evitar que se congelen cuando 
se almacenan en el exterior en climas del norte. Los datos que muestran la reduction de la consistencia 
de los pepinillos almacenados en una salmuera baja en sales (2% a 3%) se dan en la tabla siguiente. 3 4 


Semanas (x) en almacenamiento a 72°F 
0 4 14 32 52 

Firmeza (y) en libras 19.8 16.5 12.8 8.1 7.5 

a Ajuste una recta de mfnimos cuadrados a los datos. 

b Para verificar sus calculos, grafique los cinco puntos que representan a los datos y trace la recta. ^Le 
parece que la recta da un buen ajuste de los puntos? 
c Use la recta de minimos cuadrados para estimar la consistencia media de los pepinillos almacenados 
durante 20 semanas. 

11.13 La tabla siguiente proporciona datos sobre la pesca de anchoas en Peru (en millones de toneladas me- 
tricas) y los precios de harina de pescado (en dolares actuales por tonelada) durante 14 anos consecuti- 

4 

VOS. 


Precio harina de pescado (y) 

190 

160 

134 

129 

172 

197 

167 

Pesca de anchoas (x) 

7.23 

8.53 

9.82 

10.26 

8.96 

12.27 

10.28 

Precio harina de pescado (y) 

239 

542 

372 

245 

376 

454 

410 

Pesca de anchoas (x) 

4.45 

1.78 

4.0 

3.3 

4.3 

0.8 

0.5 


a Encuentre la recta apropiada de minimos cuadrados para estos datos. 
b Localice los puntos y grafique la recta como comprobacion de sus calculos. 

11.14 J. H. Matis y T. E. Wehrly 5 publican la siguiente tabla de datos sobre la proportion de peces de agua 
dulce que resisten un nivel fijo de contamination termica durante lapsos variables. 

Proportion de sobrevivientes (y) Tiempo a escala (x) 


1.00 

.10 

.95 

.15 

.95 

.20 

.90 

.25 

.85 

.30 

.70 

.35 

.65 

.40 

.60 

.45 

.55 

.50 

.40 

.55 


a Ajuste el modelo lineal Y = /3 0 + /3jX + e. De su interpretation, 
b Localice los puntos y grafique el resultado del inciso a. ^La recta pasa por los puntos? 

3. Fuente: R. W. Buescher, J. M. Hudson, J. R. Adams, and D. H. Wallace, “Calcium Makes It Possible to Store 
Cucumber Pickles in Low-Salt Brine”, Arkansas Farm Research 30(4) (1981). 

4. Fuente'. John E. Bardach and Regina M. Santerre, “Climate and the Fish in the Sea”, BioScience 31(3) (marzo de 
1981): 206ff. Copyright ©1981 by American Institute of Biological Sciences. 

5. Fuente'. J. H. Matis and T. E. Wehrly, “Stochastic Models of Compartmental Systems”, Biometrics 35(1) (1979): 
199-220. 
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11.4 Propiedades de los estimadores de mmimos 
cuadrados: regresion lineal simple 

Necesitamos determinar las propiedades estadfsticas de estimadores de mmimos cuadrados 
si deseamos usarlos para hacer inferencias estadfsticas. En esta seccion mostramos que los 
estimadores de mmimos cuadrados ySo y /S! para los parametros del modelo lineal simple 


Y = f3 0 + jSj.r + e 


son estimadores insesgados de sus respectivos valores parametricos. Tambien deduciremos 
las varianzas de estos estimadores y, dada la suposicion de que el termino de error e esta distri- 
buido normalmente, demostraremos que /3o y y 81 tienen distribuciones de muestreo normales. 
Los resultados correspondientes aplicables al modelo de regresion lineal multiple se presentan 
sin demostracion en la Seccion 11.11. 

Recuerde que previamente supusimos que e es una variable aleatoria con E(s) = 0. Ahora 
agregaremos la suposicion de que E(s) = cr 2 . Esto es, estamos suponiendo que la diferencia 
entre la variable aleatoria Y y E(Y)= /3 0 + /3 { x esta distribuida alrededor de cero con una 
varianza que no depende de x. Observe que V(Y) = V(s) = a 2 porque los otros terminos del 
modelo lineal son constantes. (Un estimador insesgado para la varianza cr 2 del termino de 
error del modelo tambien se presenta en esta seccion.) 

Suponga que se hacen n observaciones independientes de este modelo para que, antes de 
muestrear, tengamos n variables aleatorias independientes de la forma 

Yi = /3o + /3|X, + e,-. 


De la Seccion 11.3 sabemos que 


Szy = T.U (*/ -7)(Y,-Y) 
s X x i(x,-x ) 2 


que se puede escribir como 


4i 


T!i=l( x i ~ x ) Y i ~ Y Ya = l( x i ~ x ) 


Entonces, como ^'.' = (x,■ — x) = 0., tenemos 


/Si 


E?=i(*i ~x)Yi 


Debido a que todas las sumatorias de nuestro analisis se sumaran a partir de i = 1 hasta n. 
simplificaremos nuestra notacion al omitir la variable de sumatoria y su fndice. Ahora encon- 
tremos el valor esperado y la varianza de /3j. 
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De los teoremas de valores esperados desarrollados en la Section 5.8 tenemos 


£03i) = E 


J2(*i - x)Yj 

S xx 


Efc ~x)E(Yj) 


= Efe ~ x )(Po + fi*/) 

S XX 

_ o X( x l - x) x o XX X ‘ ~ X ) X i 

- Po- t; - + Pi- ■= -■ 

XX bXX 

Como J2( x i — x ) = 0 y S xx = E( x ! — x ) 2 = J2( x i ~ x)x,, tenemos 

E(fii)=0 +Pi^-=Pi. 

^xx 

Entonces, /3 1 es un estimador insesgado de (3 V 

Para hallar V(0\), usamos el Teorema 5.12. Recuerde que Y v Y 2 ,... ,Y n son independien- 
tes y, por tanto, 


V(j8i) = V 


'Efe ~x)Yj' 


' 1 ' 

S xx 


. Sxx . 


y] V[{xi -x)Yj] 


J2 (x - ~ x) 2 V(Yj). 


Debido a que V(Y) = a 2 , para i = 1,2 

- cr 2 

V(/3i) = —• 

^xx 

Ahora obtendremos el valor esperado y la varianza de 0 () . donde 0o = Y—0{x. Del 
Teorema 5.12 tenemos 

V(/3 0 ) = V(Y) +x 2 V(0i) — 2xCov(Y, 0,). 

En consecuencia, debemos hallar V(Y) y Cov( Y , 0\) para obtener V(0q). Como Y i = [3 I} + 
(3 l x i + e ; , vemos que 

Y = - Yi = A) + Pix + e. 

n ‘ J 


Entonces, 


E{Y) - /3 0 + fax + E(e) - fa + fax. 


V(Y) = V (e) = ( -Wi) = X. 

,« / n 


Para hallar Cov (T, /3i), reescribimos la expresion para /l, como 

0i = J2 CiYi ’ 


donde 
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EJEMPLO 11.2 
Solucion 


E : Kl>. 


(Observe que Y c i = 0.) Entonces, 

Cov(T, fa) = Cov 
y usando el Teorema 5.12, 

Cov(7, &) = E( 

n ) ^ + EE( 

n) ^ 1 ’ ^ 

Como y K., donde / + j, son independientes, Cov (Y t , Yj) = 0. Tambien, V (Y t ) = a 2 y, por 
tanto. 


- A O X-5 O V—> 

Cov ( Y , fa) = -Vci = — V 

n ‘ J n ‘ J 


Xi ~ X 

s xx 


= o. 


Regresando a nuestra tarea original de hallar el valor esperado y la varianza de /So = 
Y — {$[X, aplicamos los teoremas de expectation para obtener 


E(j 3 0 ) = E(Y) - E(fa)x = fa + fax - fax = fa. 


Por tanto. hemos demostrado que fay fa son estimadores insesgados de sus parametros res- 
pectivos. 

Como hemos obtenido V(Y), V(fa) y Cov(F, fa ), estamos listos para hallar V(fa). 
Como ya se ha establecido previamente usando el Teorema 5.12, 

V($ 0 ) = V(Y) +x 2 V(fa) - 2xCov(Y, fa). 


Sustituyendo los valores para V(Y), V(fa) y Cov (Y, fa), obtenemos 


V(fa) = — +x 2 [ — 


x 2 


= - + 

\ n S x 


-0 

^ 2 S >, 2 

nS xx 


Ademas (vea el Ejercicio 11.21), el Teorema 5.12 puede ser empleado para demostrar que 

Cov(/3 0 , fa) = 

^xx 

Observe que fay fa estan correlacionados (y por tanto son dependientes) a menos que 
x = 0. 

Todas las cantidades necesarias para determinar los valores de las varianzas y covarianzas 
anteriores ya han sido calculadas en el curso de obtener los valores para /So y fa- 


Encuentre las varianzas de los estimadores fay fa para el Ejemplo 11.1. 

En el Ejemplo 11.1 (vea los calculos para el denominador de /Si), encontramos que 
n = 5, ^Y/ X i = 0’ XE' 2 = I®’ 

Se deduce que x = 0, 


S xx = 10. 


V(fa) = 


o- 2 X>f _ cr 2 (10) 


nS x 


5(10) V5, 
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V(/3i) = 


10 


(T 2 . 


Observe que Cov(/3o, Pi) = 0 en este caso porque J^X; = 0. 


Las expresiones anteriores dan las varianzas para los estimadores de mlnimos cuadrados 
en terminos de cr 2 , la varianza del termino de error e. Por lo general el valor de cr 2 es descono- 
cido y necesitaremos hacer uso de observaciones muestrales para estimar cr 2 . Si se usa F para 
estimar la media, previamente usamos 


— mr,-F ) 2 

' ;=1 


para estimar la varianza poblacional cr 2 . Debido a que ahora estamos usando Y i para calcular 
E(Y t ), parece natural basar una estimacion de cr 2 en SSE = Y i — L) 2 - De hecho, de- 

mostraremos que 


S 2 = 



SSE 


proporciona un estimador insesgado para cr 2 . Observe que el 2 que se presenta en el denomi- 
nador de S 2 corresponde al numero de parametros /3 calculados en el modelo. 

Como 


E(S 2 ) = E 



SSE 


(^ 2 ) £(SSE) ' 


es necesario hallar £(SSE) para verificar que E(S 2 ) = cr 2 . 

Observe que 

£(SSE) = E - F,) 2 ] = E [^(F, - /3 0 - 

= E^iY, - Y + fax ~ &X,) 2 ] 

= E[Y^l(Yi~Y)-i 3i(x,~x)] 2 ] 

= E [^(F,- - F) 2 + - x) 2 - 2/3! J> - x)(Yi ~ H 


Como “ x)( F — F) = £(x/ — x) 2 /3i, los liltimos dos terminos en la expectation se 
combinan para dar — ft 2 ^(x,- — x) 2 . Tambien, 

^(F,-F) 2 =^F i 2 -nF 2 , 


E []T(F,. - F,) 2 ] = E Y ? ~ uy2 ~ 

= J2 E ( Y ?)- nE (Y 2 )-S x *E(p 2 ). 


y, por tanto, 
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Si observamos que, para cualquier variable aleatoria U, E(U 2 ) = V(U) + [E((J)\ 2 , vemos que 


Esta expresion se simplifica a (n - 2)cr 2 . Entonces, encontramos que un estimador insesgado 
de cr 2 esta dado por 

s2 = („-^)E«-w 2 = (^b) SSE 

Queda pendiente una tarea, hallar una forma facil de calcular —%) 2 = SSE. En el 

Ejercicio 11.15(a) se demostrara que una formula de calculo para la SSE esta dada por 

n n 

SSE = ^(y,- — y) 2 — /3i y, - y) 

1=1 1=1 

n 

= S yy - 0iS xy , donde S yy = ^(y, - yf. 


+ lEW)] 2 } - n{V(Y) + [E{Y)f} 

-Sxx{V(j8i) + [£()8i)] 2 } 

ncr +^(/3 0 +/3ix,) 2 -n " - LD ^ 2 


r cr 2 _ 

— + (/3o + ^l^') 

n 


S xx — +Pt . 


EJEMPLO 11.3 Calcule cr 2 con los datos dados en el Ejemplo 11.1. 

Solucion Para estos datos, n = 5 y ya hemos determinado que 

£>', = 5, S xy =1, 0i = .7. 
Facilmente se determina que ^ yj = \ \ y que 

Syy = ~y > 2 = T,y?- n w 2 = 11 - 5 o ) 2 = 6 -°- 


Por tanto, 

SSE = S yy — 0 \ S xy = 6.0 -(.7)(7) = 1.1, 


y 


s 2 = 


SSE 


1.1 


1.1 

= — = .367. 
2 3 


Estas deducciones establecen las medias y las varianzas de los estimadores $o y 0 1 y de- 
muestran que S 2 = SSE /(n - 2) es un estimador insesgado para el parametro cr 2 . Hasta este 
punto, las unicas suposiciones que hemos hecho acerca del termino de error e del modelo Y 
= /3 0 + jSj.v + e son que E(e) = 0 y que V{s) = a 2 , independiente de x. La forma de las dis- 
tribuciones muestrales para /3o y 0\ depende de la distribucion del termino de error e. Debido 
a que con frecuencia se presenta la distribucion normal en la naturaleza, es razonable suponer 
que e esta distribuido normalmente con media 0 y varianza cr 2 . 
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Si se garantiza esta suposicion de normalidad, se deduce que Y t esta distribuida normalmen- 
te con media P 0 + /3 l x i y varianza cr 2 . Debido a que /3 0 y [3 1 son funciones lineales de Y v 
Y 2 , , Y n . los estimadores estan distribuidos normalmente, con las medias y varianzas que 

se determinaron previamente. Ademas, si se garantiza la suposicion de normalidad, se deduce 
que 


(n -2)S 2 _ SSE 
cr 2 cr 2 

tiene una distribucion \ 2 con n — 2 grados de libertad. (La prueba de este resultado se omite.) 

Como veremos mas adelante, la suposicion de normalidad de la distribucion del termino de 
error e y las distribuciones normales resultantes para /3 0 y p t nos permitiran desarrollar prue- 
bas e intervalos de confianza basados en la distribucion t. Los resultados de esta seccion se re- 
sumen aqui por su importancia para las discusiones en secciones subsiguientes. Observe que 
V(/3o), V([3i) y Cov(0o, [3\) sontodosmultiplosconstantesdecr 2 . Como V(f3 l ) = Cov(0,. /3,), 
unificaremos la notacion y daremos coherencia a las ultimas secciones de este capftulo si usamos 
la notacion V(0 O ) = c 00 o- 2 , V(0i) = c n (r 2 y Cov($ 0 , Pi) =c 01 cr 2 . 


Propiedades de los estimadores de minimos cuadrados; regresion lineal simple 

1. Los estimadores /3 0 y son insesgados, es decir, E(pi ) = yS,, para i = 0, 1. 

2. V(/3 0 ) =c 0 oo- 2 , dondecoo = J2 x fA nS ^- 

3. y(/3j) =cno- 2 , dondec n = 

^XX 

/V /V —JC 

4. Cov($ a , PP = coicr 2 , dondecoi = —. 

^XX A 

5. Un estimador insesgado de cr 2 es S 2 = SSE /(n - 2), donde SSE = S yy — p \ S xy y 

Syy = Jliyi - y) 2 - 

Si, ademas, el s ; , para i = 1,2 ,... ,n esta distribuido normalmente, 

6. /3 0 y /3i estan distribuidas normalmente. 

(n — 2)S 2 , 

7. La variable aleatoria---tiene una distribucion \ con n - 2 grados de 

libertad. <J 

8. El estadfstico S 2 es independiente de [3 f) y (3 \. 


Ejercicios 

11.15 a Deduzca la siguiente identidad: 

n n 

SSE = - 5>,) 2 = J2 ( y -P°- Pi*i) 2 

i = 1 i — \ 

n n 

= ^(>7 - y) 2 ~ Pi -x){yi - y) = S yy - Pi S xy . 

i=1 (=1 

Observe que esto proporciona un metodo computacional mas facil para hallar la SSE. 

b Use la formula computacional para la suma de cuadrados del error (SSE), deducida en el inciso a, 
para demostrar que SSE ^ S yy . [Sugerencia: Pi = S xy /S xx .\ 





Ejercicios 583 


11.16 


11.17 


11.18 


11.19 


11.20 


11.21 


11.22 


Se realizo un experimento para observar el efecto de un aumento en temperatura en la potencia de un 
antibiotico. Tres porciones de 1 onza del antibiotico se almacenaron durante tiempos iguales a cada una 
de las siguientes temperaturas Fahrenheit: 30°, 50°, 70° y 90°. Las lecturas de potencia observadas al 
final del periodo experimental fueron como se muestra en la tabla siguiente. 


Lecturas de potencia (y) 

38, 43,29 

32, 26, 33 

19, 27, 23 

14, 19,21 

Temperatura (x) 

30° 

50° 

70° 

90° 


a Encuentre la recta de rmnimos cuadrados apropiada para estos datos. 
b Localice los puntos y grafique la recta como comprobacion de los calculos. 
c Calcule S 2 . 

a Calcule la SSE y S 2 para el Ejercicio 11.5. 

b Algunas veces es conveniente para fines de calculo, tener valores x espaciados simetrica e igualmente 
alrededor de cero. Los valores x se pueden cambiar de escala (o codificarse) en cualquier forma con¬ 
veniente sin perdida de information en el analisis estadfstico. Consulte el Ejercicio 11.5. Codifique 
los valores x (originalmente dados en una escala de 1 a 8) con el uso de la formula 

x -4.5 


A continuation ajuste el modelo Y = /3q + )3*x * + e. Calcule la SSE. (Observe que los valores x* 
son enteros simetricamente espaciados alrededor de cero.) Compare la SSE con el valor obtenido en 
el inciso a. 

a Calcule la SSE y S 2 para el Ejercicio 11.8. 

b Consulte el Ejercicio 11.8. Codifique los valores x en una forma conveniente y ajuste un modelo 
lineal simple a las mediciones de LC50 presentadas ahl. Calcule la SSE y compare su respuesta con 
el resultado del inciso a. 

Se realizo un estudio para determinar los efectos de la privation de sueno en la capacidad de las per¬ 
sonas para resolver problemas sencillos. La cantidad de privation de sueno vario en 8, 12, 16, 20 y 24 
horas sin dormir. Un total de diez individuos participaron en el estudio, dos por cada nivel de privation 
de sueno. Despues de su periodo de privation de sueno, a cada individuo se le presento un conjunto de 
problemas sencillos de sumas para que lo resolvieran, registrandose el numero de errores; se obtuvieron 
los resultados mostrados en la tabla siguiente. 


Numero de errores (y) 

8,6 6, 10 8, 14 

14, 12 

16, 12 

Numero de horas sin dormir (x) 

8 12 16 

20 

24 


a Encuentre la recta de mmimos cuadrados apropiada para estos datos. 
b Localice los puntos y grafique la recta de mmimos cuadrados en sus calculos. 
c Calcule 5 2 . 

Suponga que Y v Y 2 ,... ,Y n son variables aleatorias normales e independientes con E(Y^) = /3 0 + fi i x i y 
V(Yi) = cr 2 , para i — 1,2 , ... ,n. Demuestre que los estimadores de maxima probabilidad (MLE) de f5 0 
y f5 l son iguales que los estimadores de mmimos cuadrados de la Section 11.3. 

Deacuerdo con las suposiciones del Ejercicio 11.20, encuentre Cov(/3o, /3 1 ). Use esta respuesta para de- 
mostrar que/)(, y 0 l son independientes si J2"=i x > = 0. [Sugerencia: Cov(/3o, &i) = Cov(T-/3ix,/6i). 
Use el Teorema 5.12 y los resultados de esta section.] 

De acuerdo con las suposiciones del Ejercicio 11.20, encuentre el MLE de cr 2 . 
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11.5 Inferencias respecto a los parametros /3, 

Suponga que un ingeniero ha ajustado el modelo 


Y = P 0 + Pi x + 


donde Y es la resistencia del concreto despues de 28 dfas y x es la razon entre agua y cemento 
empleada en el concreto. Si, en realidad, la resistencia del concreto no cambia con la razon 
entre agua y cemento, entonces /3, = 0. Asf, el ingeniero puede probar H 0 : /3 l = 0 contra H a : 
f3 l A 0 para evaluar si la variable independiente tiene una influencia en la variable dependien- 
te. O bien, el ingeniero puede estimar la tasa media de cambio /3 { en E(Y) para un cambio de 
1 unidad en la proporcion x entre agua y cemento. 

En general, para cualquier modelo de regresion lineal, si el error aleatorio e esta distri- 
buido normalmente, hemos establecido que /3,- es un estimador de A insesgado y distribuido 
normalmente con 

y\x 2 

V(/3o) — c 00 o- 2 , donde coo = — 

nS xx 


y 

, l 

V(j8i) = cno- , donde cn = —. 

Esto es, las varianzas de ambos estimadores son multiplos constantes de cr 2 , la varianza del 
termino de error del modelo. Usando esta informacion, podemos construir una prueba de la 
hipotesis H 0 : f3 [ = /3, 0 ( [3 i(t es un valor especlfico de /3 ; ), usando el estadfstico de prueba 


donde 


Z = 


$i - An 


c oo 


E x ? 

nS xx 


c 11 


1 

S xx 


La region de rechazo para una prueba de dos colas esta dada por 

|z| - Z a /2- 

Como en el caso de las pruebas Z simples estudiadas en el Capftulo 10, para calcular cualquie- 
ra de los estadfsticos Z precedentes debemos conocer a o tener una buena estimacion basada 
en un numero adecuado de grados de libertad. (Lo que serfa adecuado es un punto discutible. 
Sugerimos que la estimacion sea basada en 30 o mas grados de libertad.) Cuando esta estima¬ 
cion no exista (que por lo general es el caso), puede calcularse una estimacion de cr a partir de 
los datos experimentales (de acuerdo con el procedimiento de la Seccion 11.4) y sustituirse 
por cr en el estadfstico Z. Si estimamos cr con S = \/SSE/(n — 2), puede demostrarse que la 
cantidad resultante 

T _ Pi ~ Ao 

Sx/ciJ 


tiene una distribution t de Student con n — 2 grados de libertad (vease el Ejercicio 11.27). 
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Prueba de hipotesis para A 


Ho : A - Ao- 
' A > Ao 

H 


A < Ao 
A t 4 Ao 

Estadfstico de prueba: T = 


(region de rechazo de 
(region de rechazo de 
(region de rechazo de 

A - Ao 


cola superior), 
cola inferior), 
dos colas). 


Region de rechazo: 


t > t a 
t < ~t a 


|?| > t a /2 


donde 


(alternativa de cola superior), 
(alternativa de cola inferior), 
(alternativa de dos colas), 


c _E*? 

c 00 — 


1 


Cll — 


n Sxx S XX 

Observe que t a esta basada en (« - 2) grados de libertad. 


EJEMPLO 11.4 (,Los datos del Ejemplo 11.1 presentan suficiente evidencia para indicar que la pendiente 
difiere de 0? Pruebe usando a = .05 y establezca los lfmites para el nivel de significancia 
alcanzado. 


Solucion La pregunta anterior supone que el modelo probabilfstico es una description realista de la ver- 
dadera respuesta e implica una prueba de hipotesis H 0 : A =0 contra H a : fi =£0 del modelo 
lineal Y = /3 0 + f5 x x + e. Para estos datos, determinamos en el Ejemplo 11.1 que [i t = .7 y 
= 10. El Ejemplo 11.3 dio como resultado s 2 = SSE/Oz - 2) = .367 y s = V-367 = .606. 
( Nota : la SSE esta basada en n - 2 = 3 grados de libertad). 

Como estamos interesados en el parametro /3,, necesitamos el valor 


Entonces, 


|6i -0 

sA/cTT 


.7-0 

.606VT 


3.65. 


Si tomamos a = .05, el valor de f f(/2 = t 025 para 3 grados de libertad es 3.182, y la region 
de rechazo es 


rechazar si |t| > 3.182. 

Debido a que el valor absoluto del valor calculado de t es mayor que 3.182, rechazamos la hi¬ 
potesis nula de que /3 l = 0 en el nivel de significancia a = .05. Como la prueba es de dos colas, 
el valor p = 2 P(t > 3.65), donde t tiene una distribucion t con 3 grados de libertad. Usando la 
Tabla 5, Apendice 3, encontramos que .01 < Pit 3.65) .025. Entonces, concluimos cjue 

.02 < valor p < .05. En consecuencia, rechazariamos la hipotesis nula para cualquier valor de 
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a > .05. Para valores dc a < .02, no rechazarfamos la hipotesis nula. Si hubieramos escogido .02 < 
a < .05, se requerirfa informacion mas especffica acerca del valor p. La aplicacion Student's 
1 Probabilities and Quantiles dice que, con 3 grados de libertad, el valor p = 2P(t > 3.65) = 
2(.01775) = .0355. De nuevo observamos el acuerdo entre las conclusiones alcanzadas por el 
procedimiento de prueba formal (a fija) y la interpretation correcta del nivel de signibcancia 
alcanzado. 

Como paso adicional del analisis, podrfamos ver el ancho de un intervalo de conbanza para 
f3 l para ver si es lo subcientemente corto para detectar una desviacion de cero que serfa de 
signibcancia practica. Demostraremos que el intervalo de conbanza para /3, es bastante ancho, 
lo que sugiere que el experimentador necesita recolectar mas informacion antes de tomar una 
decision. ■ 


Con base en el estadfstico t dado antes, podemos seguir los procedimientos del Capftulo 
10 para demostrar que un intervalo de conbanza para /3„ con coebciente de conbanza 1 - a, 
esta dado por: 


Un intervalo de confianza 100(1 - a)% para /3, 


donde 


c oo — 


& ± 
L-l 2 

nS xx 


la /2 5 \ Cji , 



EJEMPLO 11 .5 Calcule un intervalo de conbanza de 95% para el parametro f3 l del Ejemplo 11.4. 


Solution 


El valor tabulado para 1 025 , basado en 3 grados de libertad, es 3.182. Entonces el intervalo de 
conbanza de 95% para /3j es 

/3i ± t. 025 s\/c^. 


Sustituyendo, obtenemos 

.7 ±(3.182)(.606)V(LT, o .7 ± .610. 


Si deseamos estimar /3 l correcta con tolerancia de no mas de .15 unidad, es obvio que el inter¬ 
valo de conbanza es demasiado ancho y que el tamano muestral debe ser aumentado. ■ 


Ejercicios 

11.23 Consulte el Ejercicio 11.3 

a ^Los datos presentan suficiente evidencia para indicar que la pendiente /3 l difiere de cero? (Pruebe en 
el nivel de signibcancia de 5%.) 

b r,Que se puede decir acerca del nivel de signibcancia alcanzado asociado con la prueba implantada 
en el inciso a usando una tabla del apendice? 
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c Ejercicio Applet ^Que se puede decir acerca del nivel de significancia alcanzado asociado con la 
prueba realizada en el inciso a usando la aplicacion apropiada? 
d Encuentre un intervalo de confianza de 95% para /3 1 . 

11.24 Consulte el Ejercicio 11.13. ^Los datos presentan suficiente evidencia para indicar que el tamafio x de la 
pesca de anchoas aporta information para la prediction del precio y de la harina de pescado? 

a Determine los llmites sobre el nivel de significancia alcanzado. 
b Ejercicio Applet ,',Cual es el valor p exacto? 

c Con base en sus respuestas a los incisos a y/o b, ^que concluirfa en el nivel de significancia de a = 
. 10 ? 

11.25 ^Los datos del Ejercicio 11.19 presentan suficiente evidencia para indicar que el numero de errores esta 
relacionado linealmente con el numero de horas sin dormir? 

a Determine los llmites sobre el nivel de significancia alcanzado. 
b Ejercicio Applet Determine el valor p exacto. 

c Con base en sus respuestas a los incisos a y/o b, ^que concluirfa en el nivel de significancia de a 
= .05? 

d ^Esperarla que la relation entre y y x fuera lineal si .r se hace variar en una amplitud mas ancha, por 
ejemplo de x = 4 a x = 48? 

e Obtenga un intervalo de confianza de 95% para la pendiente. De una interpretation practica para esta 
estimation de intervalo. 

11.26 A la mayorla de los estudiantes de segundo ano de flsica se les pide que realicen un experimento para 
verificar la ley de Hooke. La ley de Hooke establece que cuando se aplica una fuerza a un cuerpo que es 
largo en comparacion con su area de section transversal, el cambio y en su longitud es proporcional a la 
fuerza x; esto es, 


y = Pi x > 


donde f3 i es una constante de proporcionalidad. Los resultados del experimento de laboratorio de un 
estudiante de flsica se muestran en la siguiente tabla. Se usaron seis tramos de alambre de acero, de .34 
millmetro (mm) de diametro y 2 metros (m) de largo, para obtener las seis mediciones de cambio de 
fuerza-longitud. 


Fuerza 
x (kg) 

Cambio en longitud 
O) (mm) 

29.4 

4.25 

39.2 

5.25 

49.0 

6.50 

58.8 

7.85 

68.6 

8.75 

78.4 

10.00 


a Ajuste el modelo, Y = /3 0 + jSjX + e, a los datos, usando el metodo de mlnimos cuadrados. 
b Encuentre un intervalo de confianza de 95% para la pendiente de la recta. 

c De acuerdo con la ley de Hooke, la recta debe pasar por el punto (0, 0); esto es, f5 0 debe ser igual a 0. 
Pruebe la hipotesis de que E ( Y) = 0 cuando x = 0. Determine los llmites para el nivel de significan¬ 
cia alcanzado. 

d Ejercicio Applet ( ',Cual es el valor p exacto? 
e (,Que concluirfa usted en nivel a = .05? 

11.27 Use las propiedades de los estimadores de mlnimos cuadrados dados en la Section 11.4 para completar 
lo siguiente. 
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a Demuestre que dada la hipotesis nula H 0 : f3 i = /3 i0 

j, _ Pi ~ ftp 
Sy/cfi 

tiene una distribution t con n - 2 grados de libertad, donde i — 1,2. 
b Deduzca los intervalos de confianza para dados en esta seccion. 

11.28 Suponga que Y v Y 2 , ... ,Y n son variables aleatorias distribuidas normalmente e independientes, con 
E(Yj) = p o + y V(i') = <x 2 , para i = 1,2,..., n. Demuestre que la prueba de razon de verosimi- 
litudes de H 0 : /3 1 = 0 contra H a : f3 x # 0 es equivalente a la prueba t dada en esta seccion. 

*11.29 Sean Pj, Y 2 ,. . ., Y n variables aleatorias como las dadas en el Ejercicio 11.28. Suponga que tenemos un 
conjunto adicional de variables aleatorias independientes W v W 2 , • • ■ , W m , donde esta distribuida 
normalmente con E (W^) = y 0 + -yjC,- y V (V^.) = cr 2 , para i = 1,2,..., m. Construya una prueba de H 0 : 
P x = y! contra H a \$ x ± y v 6 

11 .30 El octanaje Y del petroleo refinado esta relacionado con la temperatura x del proceso de refinacion, pero 
tambien esta relacionado con el tamano de partfculas del catalizador. Un experimento con un catalizador 
de partfculas pequenas dio como resultado una recta de mfnimos cuadrados de 

y = 9.360 + .155*, 

con n =31, V(pi) = (.0202) 2 y SSE = 2.04. Un experimento independiente con un catalizador de 
partfculas grandes dio como resultado 

y =4.265 + .190*, 

con n = 11, V(j8i) = (.0193) 2 y SSE = 1.86. 7 

a Pruebe las hipotesis de que las pendientes son considerablemente diferentes de cero, con cada prueba 
en el nivel de significancia de .05. 

*b Pruebe con un nivel de significancia de .05 que los dos tipos de catalizador producen la misma pen- 
diente en la relation entre el octanaje y la temperatura. (Use la prueba que desarrollo en el Ejercicio 
11.29.) 

1 1.31 Usando un procedimiento qufmico llamado polarografia de pulso diferencial, un qufmico midio la co- 
rriente pico generada (en microamperes, p. A) cuando soluciones que contienen diferentes cantidades 
de nfquel (medidas en partes por mil millones, ppmm) se agregan a diferentes porciones de la misma 
solution amortiguadora. 8 ^Hay suficiente evidencia para indicar que la corriente pico aumenta cuando 
aumentan las concentraciones de nfquel? Use a = .05. 


* = Ni (ppmm) y 

= Corriente pico(/xA) 

19.1 

.095 

38.2 

.174 

57.3 

.256 

76.2 

.348 

95 

.429 

114 

.500 

131 

.580 

150 

.651 

170 

.722 


6. Los ejercicios precedidos por un asterisco son opcionales. 

7. Fuente : Gweyson and Cheasley, Petroleum Refiner (agosto de 1959): 135. 

8. Fuente'. Daniel C. Harris, Quantitative Chemical Analysis, 3rd ed. (New York, Freeman, 1991). 
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11.32 Consulte los Ejercicios 11.5 y 11.17. 

a ^Hay suficiente evidencia para indicar que la mediana de los precios de venta de casas unifamiliares 
nuevas aumento en el periodo de 1972 a 1979 en el nivel de significance de .01? 
b Estime el aumento anual esperado en la mediana de los precios de venta construyendo un intervalo 
de confianza de 99%. 

11.33 Consulte los Ejercicios 11.8 y 11.18. ^Hay suficiente evidencia de una relacion lineal entre las LC50 de 
flujo y estaticas? Pruebe al nivel de significance de .05. 

11.34 Consulte el Ejercicio 11.33. ^Hay suficiente evidencia de una relacion lineal entre las LC50 de flujo y 
estatica? 

a Determine los llmites para el nivel de significance alcanzado. 
b Ejercicio Applet ^Cual es el valor p exacto? 

11.6 Inferencias respecto a funciones lineales 
de los parametros del modelo: 
regresion lineal simple 

Ademas de hacer inferencias acerca de una f3 , individual, a menudo nos interesa hacer in¬ 
ferencias acerca de funciones lineales de los parametros del modelo /3 0 y /3,. Por ejemplo, 
podnamos calcular E(Y). dada por 

E(Y) = p 0 + /3pc, 

donde E ( Y) representa el rendimiento medio de un proceso qufmico para los ajustes de la va¬ 
riable x de un proceso controlado, o el rendimiento de combustible por milla de recorrido de 
motores de gasolina de cuatro cilindros con volumen x de cilindrada. Las propiedades de los 
estimadores de estas funciones lineales se establecen en esta seccion. 

Suponga que deseamos hacer una inferencia acerca de la funcion lineal 

$ — fl oA) fl i/E 

donde a 0 y a, son constantes (una de las cuales puede ser igual a cero). Entonces, la misma 
funcion lineal de los estimadores de los parametros 

0 = aofio + «i/3i, 

es un estimador insesgado de 9 ya que, por el Teorema 5.12, 

E(6) = aoE(po) + a\E(fi\) = «oA) + a \P\ = 9. 

Si aplicamos el mismo teorema, determinamos que la varianza de 9 es 

V(9) = a 2 0 V($ 0 ) + ajVOSO + 2 flofll Cov(/3 0 , £,), 
donde V ($,) = cacr 2 y Cov(/3 0 , /3i) = coitr 2 , con 

E *, 2 _ i 

> C H - 7T- 
n ^xx 3 xx 



coo — 
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Con algunas manipulaciones algebraicas de rutina tendremos 

,E-v, 2 

J «c 

V('9) = 


+ al 


■ 2gqciix 


Por ultimo, recordando que /So y /3 1 estan distribuidas normalmente en muestreo repetido 
(Section 11.4), es evidente que 9 es una funcion lineal de variables aleatorias distribuidas 
normalmente, lo cual implica que 0 esta distribuida normalmente. 

Entonces, concluimos que 




tiene una distribucion normal y podria emplearse para probar la hipotesis 


cuando 9 0 es algtin valor especificado de 9 = a 0 f3 0 + cq/3 v Del mismo modo, un intervalo de 
confianza de 100(1 - a)% para 9 = a 0 /3 0 + a l [3 l es 

0 — Za/2^0 • 

Observamos que ta nto en el estadfstico Z como en el intervalo de confianza inmediato 
anterior, erg = \j V(9 ) es un miiltiplo constante de cr (dependiendo del tamano muestral n, 
de los valores de las x y de los valores de las a). Si sustituimos S por cr en la expresion para 
Z, la expresion resultante (que identificamos como 7) tiene una distribucion t de Student en 
muestreo repetido, con n — 2 grados de libertad y proporciona un estadfstico de prueba para 
verificar la hipotesis acerca de 9 = a 0 /3 0 + a l [3 l . 

A continuacion se resumen pruebas adecuadas. 


Una prueba para 6 = a 0 Po + «i/3, 

H 0 : 9 = 9o, 

9>9 0 , 

H a : 9 < 9o, 

9 f 9 () . 

Estadfstico de prueba: T = - 


9-9 0 




+ a j — 2aoaiX 


S 

N 

t > t a . 

Region de rechazo: t < —t a , 

|f| > ta/2- 

Aquf, t a y 4/2 estan basados en n - 2 grados de libertad. 
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El intervalo de confianza correspondiente de 100(1 - a)% para 6 = a 0 /3 0 + a l 0 l es el si- 
guiente. 


Un intervalo de confianza 100(1 

- a) % para 6 = a„p it + a l p i 

6 ± t a / 2 S 

\ 

donde la t a p tabulada esta basada e 

/ ,E X? 2 \ 

/ - + af — 2aoa\x 

!■ 

l " } 

an- 2 grados de libertad. 


Una aplicacion util de las tecnicas de prueba de hipotesis e intervalo de confianza que 
acabamos de presentar es el problema de estimar E(Y), el valor medio de Y, para un valor fijo 
de la variable independiente x. En particular, si x* denota un valor especffico de x que es de 
interes, entonces 

E(Y) =/3o + l3iX*. 


Observe que E(Y) es un caso especial de a 0 f 3 0 + a Y P v con a 0 = 1 y a l = x*. Entonces, se 
puede hacer una inferencia acerca de E(Y) cuando x = x* usando las tecnicas desarrolladas 
anteriormente para combinaciones lineales generales de las /3. 

En el contexto de estimar el valor medio de Y, E{Y) = /3 0 + P x x* cuando la variable in¬ 
dependiente x toma el valor x*, se puede demostrar (vea el Ejercicio 11.35) que, con a Q = 1, 
flj = x*. 


lat^+at 

l “ E7 


2.GqG\X 


\ 


1 (x* — x) 2 

- + - -— 

n S xx 




Un intervalo de confianza para el valor medio de Y cuando x = x*, un valor particular de x es 
el siguiente. 


Un intervalo de confianza 100(1 -a)% para E(Y) = A, + /V* 

~ ^ „ f 1 (x* — x) 2 

pO + PlX ± t a /2S - + - ---, 

V n S xx 

donde la t a p tabulada esta basada en n - 2 grados de libertad. 


Esta formula permite ver con facilidad que para un valor fijo de n y para valores x dados, 
el intervalo de confianza mas corto para E(Y) se obtiene cuando x* =x, el promedio de los 
valores x empleados en el experimento. Si nuestro objetivo es planear un experimento que 
arroje intervalos de confianza cortos para E(Y) cuando x = x*, n debe ser grande, S xx debe ser 
grande (si es posible) y x debe ser cercana a x*. La interpretacion ffsica de una S xx grande es 
que, cuando sea posible, los valores de x empleados en el experimento deben estar tan disper- 
sos como sea posible. 
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EJEMPLO 11.6 

Solucion 


11.35 

11.36 

11.37 


Para los datos del Ejemplo 11.1, determine un intervalo de confianza de 90% para E(Y) cuan- 
do x = 1. 

Para el modelo del Ejemplo 11.1, 


E(Y) = (3 0 + fax. 

Para estimar E(Y) para cualquier valor fijo x = x*, usamos el estimador insesgado E{Y) = 
fio + p\x*. Entonces, 

$o +$ix* = 1 + -lx*. 

Para este caso, x* = 1; y como n = 5,x = 0 y = 10, se deduce que 

1 (x*-x) 2 1 (1 — 0) 2 

- + --— = - + --— = .3. 

n S xx 5 10 

En el Ejemplo 11.3 encontramos que s 2 es .367 o s = .606, para estos datos. El valor de t 05 
con n- 2 = 3 grados de libertad es 2.353. 

El intervalo de confianza para E(Y) cuando x = 1 es 

» ~ „ [l (x* — x) 2 

fio + 0lX ± taps — + --- 

v n S xx 
[(1 +(.7)(1)] ± (2.353)(.606)Vj 
1.7 ± .781. 

Esto es, tenemos confianza de 90% en que, cuando la variable independiente tome el valor 
de x = 1, el valor medio E(Y) de la variable dependiente es entre .919 y 2.481. Este intervalo 
obviamente es muy ancho, pero recuerde que esta basado en solo cinco puntos y se empleo 
solo para fines de ilustracion. Demostraremos algunas aplicaciones practicas del analisis de 
regresion en la Seccion 11.9. ■ 


Ejercicios 


Para el modelo de regresion lineal simple Y = /3 0 + /3jX + e con E(s) = 0 y V(e) = cr 2 , use la expresion 
para V(a 0 j3 0 + aipi) deducida en esta seccion para demostrar que 


Vipa+Pix*) 


1 

- + 
n 



cr 


2 


^Para que valor de x* alcanza su longitud minima el intervalo de confianza para E (F)? 

Consulte los Ejercicios 11.13 y 11.24. Encuentre el intervalo de confianza de 90% para el precio 
medio por tonelada de harina de pescado si la captura de anchoas es de 5 millones de toneladas me- 
tricas. 

Usando el modelo ajustado para los datos del Ejercicio 11.8 construya un intervalo de confianza de 95% 
para el valor medio de LC50 de flujo para un toxico que tiene un LC50 estatico de 12 partes por millon. 
(Vease tambien el Ejercicio 11.18.) 











11.7 Prediccion de un valor particular de Y mediante regresion lineal simple 593 


11.38 

11.39 

11.40 

*11.41 


11.7 


Consulte el Ejercicio 11.3. Encuentre un intervalo de confianza de 90% para E(Y) cuando x* = 0. 
Entonces encuentre intervalos de confianza de 90% para E{Y) cuando x* = —2 y x* = +2. Compare 
las amplitudes de estos intervalos. Localice estos llmites de confianza en la grafica construida en el 
Ejercicio 11.3. 

Consulte el Ejercicio 11.16. Determine un intervalo de confianza de 95% para la potencia media de una 
onza de antibiotico almacenado a 65°F. 

Consulte el Ejercicio 11.14. Determine un intervalo de confianza de 90% para la proportion esperada de 
sobrevivientes en el periodo .30. 

Consulte el Ejercicio 11.4. Suponga que la muestra dada aht provino de una poblacion grande pero fi- 
nita de articulos de inventario. Deseamos calcular la media poblacional de los valores auditados usando 
el hecho de que los valores en libros se conocen para cualquier articulo en inventario. Si la poblacion 
contiene N articulos y 


E VO = Mi = A> + 

entonces la media poblacional esta dada por 

1 » / ! \ * 

Mr = = Po + Pi y — Jz2 Xi = #> 

a Usando los estimadores de minimos cuadrados de /3 0 y demuestre que /jl y puede ser estimada 
por 

Mr = y + Pi(v-x ~x). 

(Observe que y se ajusta arriba o abajo, dependiendo de si x es mayor o menor que /jl x .) 

b Usando los datos del Ejercicio 11.4 y el hecho de que /u t = 74.0, calcule /jl y , la media de los valores 
auditados, y ponga un lfmite de desviacion estandar de 2 en el error de estimation. (Considere los 
valores de x t como constantes cuando calcule la varianza de jx Y .) 


Prediccion de un valor particular de Y 
mediante regresion lineal simple 

Suponga que para una presion fija, el rendimiento Y para un experimento qumiico es una 
funcion de la temperatura x a la que el experimento se efectua. Suponga que un modelo lineal 
de la forma 


Y = p o + p Y x + e 

representa adecuadamente la funcion de respuesta trazada por Y sobre la region experimental 
de interes. En la Section 11.6 estudiamos metodos para estimar el rendimiento medio E(Y) 
del proceso en el ajuste x = x*. 

Ahora considere un problema diferente. En lugar de calcular el rendimiento medio en x*, 
deseamos predecir la respuesta particular Y que observaremos si el experimento se ejecuta 
en el futuro (por ejemplo el proximo lunes). Esta situation ocurrirfa si, por alguna razon, la 
respuesta del proximo lunes tuviera un significado especial para nosotros. Los problemas de 
prediccion ocurren con frecuencia en los negocios, donde podriamos estar interesados en las 
utilidades del siguiente mes de una inversion espetifica en lugar del promedio de ganancia por 
inversion en una cartera de valores grande de acciones similares. 
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Observe que Y es una variable aleatoria, no un parametro, por lo que predecir su valor repre- 
senta apartarnos de nuestra meta previa de hacer inferencias acerca de parametros poblaciona- 
les. Si es razonable suponer que e esta distribuido normalmente con media 0 y varianza cr 2 , se 
deduce que Y esta distribuida normalmente con media f3 0 + fi^x y varianza cr 2 . Si se conoce la 
distribucion de una variable aleatoria Y y entonces se selecciona un solo valor de Y, ^como se 
pronosticarfa el valor observado? Afirmamos que usted seleccionana un valor de Y cercano al 
centro de la distribucion, en particular un valor cercano al valor esperado de Y. Si estamos in- 
teresados en el valor de Y cuando x = x*, emplearfamos Y* = /3 (l + /3ix* como pronosticador 
de un valor particular de Y* y tambien como estimador de E(Y). 

Si x = x*, el error de predecir un valor particular de Y*, usando Y* como el pronosticador, 
es la diferencia entre el valor real de Y* y el valor pronosticado: 

error = Y* — Y*. 

Investiguemos ahora las propiedades de este error en el muestreo repetitivo. 

Como Y* y Y* son variables aleatorias distribuidas normalmente, su diferencia (el error) 
tambien esta distribuida normalmente. 

Al aplicar el Teorema 5.12, que proporciona las formulas para el valor esperado y la 
varianza de una funcion lineal de variables aleatorias, obtenemos 

E(e rror) = E(Y* -Y s ) = E(Y*) - E(Y*), 
ycomo£’(y*) = /3 q + ji\X* = E(Y*), 


£(e rror) = 0. 


Del misrno modo, 


V(error) = V(Y* - Y *) = V(Y*) + V(Y*) - 2Cov(r*, Y*). 


_Debido a que estamos_pronosticando un valor futuro de Y* que no se emplca en el calculo de 

Y*, se deduce que Y* y Y* son independientes y por tanto que CovO / '\ Y*) = 0. Entonces, 

V (error) = V{Y*) + V(P) = cr 2 + V(^ 0 + )3iX*) 


= o - 2 + | - + 
, n 


1 (x* - x) 


—\2 


= ^2 


1 (x* x) 2 

1 + - + --— 


Hemos demostrado que el error de pronosticar un valor particular de Y esta distribuido 
normalmente con media 0 y varianza como se da en la ecuacion precedente. Se deduce que 


Z = 


/ 1 (x* - x) 2 

i + -+ _ 

V n S xx 

tiene una distribucion normal estandar. Ademas, si S es sustituida por cr, se puede demostrar 
que 


T = 


Y* _ y* 


/ 1 (x* - x) 2 

sJ i + - + v _ 

V n S xx 
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tiene una distribution t de Student con n - 2 grados de libertad. Usamos este resultado para 
calcular el lfmite en el error de prediccion; al hacerlo, construimos un intervalo de prediccion 
para la variable aleatoria Y*. El procedimiento empleado es similar al usado para construir los 
intervalos de confianza presentados en los capftulos anteriores. 

Empezamos por observar que 


P(~t a /2 <T < t a / 2 ) = 1 - a. 


Sustituyendo por T, obtenemos 


P 


ta/2 < 


Y * - Y * 


<t, 


/ 1 (jc* — x) 2 

s A /i + -+ y 

V n S xx 


a/2 


= 1 — a. 


En otras palabras, en un muestreo repetitivo la desigualdad dentro del parentesis rectangular se 
cumplira con una probabilidad igual a (1 - a). Ademas, la desigualdad continuara cumplien- 
dose con la misma probabilidad si cada termino se multiplica por el mismo factor positivo o si 
la misma cantidad se suma a cada termino de la desigualdad. Multiplique cada termino por 


/ 1 (x* - x) 2 

SJ 1 + — + --- 


y luego sume Y* a cada uno para obtener 


.—- / 1 (x* — x) 2 * 

Y ~ t a/2 S 1 + - + < Y 


-—- / 1 (x* — x) 2 

<r. + ,^/i + - + L_L 


= 1 — a. 


Entonces, hemos colocado un intervalo alrededor de Y* que en muestreo repetido contendra 
el valor real de Y* con probabilidad 1 - a. Esto es, hemos obtenido un intervalo de prediccion 
de 100(1 - a)% para Y*. 


Intervalo de prediccion de 100(1 - a)% para Y cuando x = x* 


ft, + j§ix* ± t a/2 s i + - + (x x)2 . 


Al tratar de poner un limite en el error de pronosticar Y, esperarfamos que el error fuera 
menor en valor absoluto que 


„ L 1 (x* - x) 2 

t a /2S 1 + - + --- 


con probabilidad igual a (1 - a). 
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EJEMPLO 11.7 

Solution 


Observe que la longitud de un intervalo de confianza para E(Y) cuando x = x* esta dada por 


/1 (x* — x) 2 

2 X tafiS ~ + ---, 


mientras que la longitud de un intervalo de prediction para un valor real de Y cuando x = x* 
esta dada por 


/ 1 (x* — x) 2 

2 X t a/2 S. 1 + - +---. 

V n Sxx 


Entonces, observamos que los intervalos de prediction para el valor real de Y son mas largos que 
los intervalos de confianza para E(Y) si ambos estan determinados por el mismo valor de x*. 


Suponga que el experimento que genero los datos del Ejemplo 11.1 se va a realizar de nuevo 
con x = 2. Pronostique el valor particular de Y con 1 - a = .90. 

Del Ejemplo 11.1, tenemos 

/3 0 = 1 y /3 1 = .7, 

de modo que el valor pronosticado de Y con x = 2 es 

/3 0 +/3ix* = 1 + (.7)(2) = 2.4. 

Ademas, con x* = 2, 

1 (x* - x) 2 1 (2 ~ 0) 2 

- + --— = - + --— = . 6 . 

n S xx 5 10 

Del Ejemplo 11.3 sabemos que s = .606. El valor t 05 con 3 grados de libertad es 2.353. Por 
tanto, el intervalo de prediction es 

~ - * / 1 (x* — x) 2 

Po + P\X ± t a /2S 1 + - + --- 

V « S X X 

2.4 ± (2.353)(.606)V 1 + .6 

2.4 ± 1.804. ■ 


La Figura 11.7 representa algunos datos hipoteticos y la recta de regresion estimada, ajus- 
tada a la information que indica el valor estimado de E(Y) cuando x = 8. Tambien se muestran 
en la grafica las bandas de confianza para EiY). Para cada valor de x, calculamos 

/ 1 ( v — 

$o+$ix±t a/2 S - + 

v n S xx 

Por tanto, para cada valor de x obtenemos un intervalo de confianza para E ( Y). El intervalo de 
confianza para E{Y) cuando x = 7 se muestra en el eje y de la figura. Observe que la distancia 
entre las bandas de confianza es mas pequena cuando x = x, como se esperaba. Usando el 
mismo metodo, calculamos bandas de prediction de un valor Y real para cada ajuste de x. 
Como ya dijimos antes, para cada valor fijo de x, el intervalo de prediction es mas ancho que 
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FIGU RA 11.7 
Alguna informacion 
hipotetica y 
bandas de confianza 
y prediccion con 
el la relacionadas 



el intervalo de confianza correspondiente. El resultado es que las bandas de prediccion caen 
uniformemente mas lejos de la recta de prediccion que las bandas de confianza. Las bandas de 
prediccion tambien estan mas cercanas entre sf cuando x = x. 


Ejercicios 

11.42 Suponga que el modelo Y = /3 0 + fi Y x + e se ajusta a los n puntos Cvj, jq), . . ., (v„, x n ). £A que valor de 
x se minimiza la longitud del intervalo de prediccion para Y1 

11.43 Consulte los Ejercicios 11.5 y 11.17. Use los datos y el modelo dados ahf para construir un intervalo de 
prediccion de 95% para la mediana de los precios de venta en 1980. 

11.44 Consulte el Ejercicio 11.43. Encuentre un intervalo de prediccion de 95% para la mediana de los precios 
de venta para el ano 1981. Repita para 1982. ^Considerarfa adecuado utilizar este modelo y los datos del 
Ejercicio 11.5 para predecir la mediana de los precios de venta para el ano 1988? 

11.45 Consulte los Ejercicios 11.8 y 11.18. Encuentre un intervalo de prediccion de 95% para un LC50 de flujo 
si se observa que el LC50 estatico es de 12 partes por rnillon. Compare la longitud de este intervalo con 
la del intervalo hallado en el Ejercicio 11.37. 

11.46 Consulte el Ejercicio 11.16. Encuentre un intervalo de prediccion de 95% para la potencia de una onza 
de antibiotico almacenado a 65°F. Compare este intervalo con el calculado en el Ejercicio 11.39. 

11.47 Consulte el Ejercicio 11.14. Encuentre un intervalo de prediccion de 95% para la proporcion de sobre- 
vivientes cuando x = .60. 













598 Capftulo 11 Modelos lineales y estimacion por mfnimos cuadrados 

11.8 Correlacion 

Las secciones previas de este capftulo se ocuparon de modelar una respuesta Y como funcion 
lineal de una variable no aleatoria x para que pudieran hacerse inferencias apropiadas respecto 
al valor esperado de Y o un valor futuro de Y para un valor dado de x. Estos modelos son utiles 
en dos situaciones practicas bastante diferentes. 

Primero, la variable x puede ser controlada completamente por el experimentador. Esto 
ocurre, por ejemplo, si x es el ajuste de temperatura y Y es el rendimiento en un experimento 
qufmico. Entonces, x es solo el punto en el cual se fija la temperatura marcada cuando el 
experimento se ejecuta. Desde luego, x podrfa variar de un experimento a otro, pero bajo el 
completo control del experimentador, hablando en terminos practicos. El modelo lineal 

Y = |S 0 + jSjX + e 


implica entonces que 


E(Y) = /3 0 + /3pc 

o que el rendimiento promedio sea una funcion lineal del ajuste de temperatura. 

En segundo termino, la variable x puede ser un valor observado de una variable aleatoria X. 
Por ejemplo, podrfamos relacionar el volumen de madera utilizable Y en un arbol con la cir- 
cunferencia X de la base. Si pudiera establecerse una relacion funcional, entonces en el futuro 
podrfamos predecir la cantidad de madera en cualquier arbol con solo medir la circunferencia 
de la base. Para esta situacion usamos el modelo 

Y = j3 0 + [ipc + e 


para implicar que 


E(Y\X = x) = p 0 + p { x. 

Esto es, estamos suponiendo que la esperanza condicional de Y para un valor fijo de X es una 
funcion lineal del valor x. Por lo general suponemos que la variable aleatoria vectorial ( X , Y) 
tiene una distribucion normal bivariable con E(X) = /jl x , E(Y) = /jl y , V(X) = <j 2 x , V(Y) = a 2 Y , 
y el coeficiente de correlacion p (vease la Seccion 5.10), en cuyo caso se puede demostrar que 


E(Y\X = x) = (3 0 + P Y x, donde = —p. 

Ojf 


La teorfa estadfstica para hacer inferencias acerca de los parametros /3 0 y (3 l es exactamente 
igual para estos dos casos, pero las diferencias en interpretacion del modelo deben recordarse. 

Para el caso donde ( X , Y) tiene una distribucion bivariable, el experimentador no siempre 
puede estar interesado en la relacion lineal que define E(Y\X). El o ella pueden querer saber 
solo si las variables aleatorias X y Y son independientes. Si (X, Y) tiene una distribucion nor¬ 
mal bivariable (vease la Seccion 5.10), entonces la prueba de independencia es equivalente a 
probar si el coeficiente de correlacion p es igual a cero. Recuerde de la Seccion 5.7 que p es 
positiva si X y Y tienden a aumentar juntas y p es negativa si Y disminuye cuando X aumenta. 

Denotemos con (Aj, Vj), (X 2 , Y 2 ), . . . , (X n , Y n ) una muestra aleatoria de una distribucion 
normal bivariante. El estimador de maxima probabilidad de p esta dado por el coeficiente de 
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correlacion muestral: 

E"=i(*|- -XXY, -Y) 

J'LUiXi-xp'EUW-Y)* 

Observe que podemos expresar r en terminos de cantidades conocidas: 



Se deduce que r y j8j tienen el mismo signo. 

En el caso donde (X, Y) tenga una distribucion normal bivariable, hemos indicado que 

E(Y \X = x) = j8o + (S\X, donde ySi = —p. 

ox 

Entonces, por ejemplo, probar H 0 : p = 0 contra H a : p > 0 es equivalente a probar H 0 : /3 = 
0 contra H a : // > 0. Del mismo modo, H a : p < 0 es equivalente a H a : (3 l < 0yH a :pJ=0 
es equivalente a H a : f5 ] 0. Las pruebas para cada uno de estos conjuntos de hipotesis que 

contienen /5 i pueden estar basadas (vease la Seccion 11.5) en el estadfstico 

t = 0i -0 

S /\/ SXX 

que tiene una distribucion t con n - 2 grados de libertad. De hecho (vease el Ejercicio 11.55), 
este estadfstico se puede reescribir en terminos de r como sigue: 

r\/n — 2 

\/l ~ r 2 

Debido a que los dos estadfsticos t anteriores son equivalentes algebraicos, ambos tienen la 
misma distribucion: la distribucion t con n - 2 grados de libertad. 

Parecerfa logico usar r como estadfstico de prueba para probar hipotesis mas generales 
acerca de p, pero la distribucion de probabilidad para r es dificil de obtener. La dificultad pue¬ 
de ser superada, en muestras moderadamente grandes, usando el hecho de que (1/2) ln[(l + 
r)/( 1 - r)] esta distribuida normalmente en forma aproximada con media (1/2) ln[(l + p)/(l 
- p)] y varianza 1 jin - 3). Entonces, para probar la hipotesis //„: p = p 0 , podemos emplear 
una prueba Z en la que 



yjn — 3 


Si a es la probabilidad deseada de cometer un error tipo I, la forma de la region de rechazo 
depende de la hipotesis alternativa. Las diversas alternativas de interes mas frecuente y corres- 
pondientes regiones de rechazo son las siguientes: 

H a -P>po, 

Ha- P< po, 

H a . p 7^ po, 


Ilustramos con un ejemplo. 


RR :z > z a , 
RR :z < ~z a , 
RR : kl > Za/2 
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EJEMPLO 11.8 Los datos de la Tabla 11.3 representan una muestra de las calificaciones de un examen de co- 
nocimientos matematicos y las calificaciones de calculo para diez estudiantes de primer ano 
de universidad seleccionados de manera independiente. Dada esta evidencia, ^dirfa usted que 
las calificaciones del examen de conocimientos matematicos y las calificaciones de calculo 
son independientes? Use a = .05. Identifique el correspondiente nivel de significancia alcan- 
zado. 


Solucion Establezcamos como hipotesis nula que Xy Y son independientes; o bien, suponiendo que ( X, Y) 
tenga una distribution normal bivariable, probamos H 0 \ p = 0 contra H a \ p j= 0. Como estamos 
concentrados en p = 0, la prueba puede estar basada en el estadfstico t = (r\Jn — 2) f\J\ — r 1 . 
Si denotamos con x las calificaciones del examen de conocimientos matematicos y las califica¬ 
ciones de calculo con y, tenemos 


Xi = 460, 

= 23 634, 

S„ = 2474, 

= 760, 

I> 2 = 59 816 ’ 

S yy = 2056, 

= 36 854 > 


S xy = 1894. 


Entonces, 


S xy _ 1894 

~ Vt2474)(2056) 


.8398. 


El valor del estadfstico de prueba es 

_rX r fT = 2_ (,8398)V8 
VT^T 1 Vl - .7053 


Debido a que t esta basada en n - 2 = 8 grados de libertad, t a / 2 = t 025 = 2.306; el valor ob- 
servado de nuestro estadfstico de prueba se encuentra en la region de rechazo. Por tanto, la 
evidencia sugiere enfaticamente que las calificaciones del examen de conocimientos matema¬ 
ticos y las calificaciones de calculo son dependientes. Observe que a = .05 es la probabilidad 
de que nuestro estadfstico de prueba caiga en la region de rechazo cuando H 0 es verdadera. En 
consecuencia, confiamos razonablemente en que hemos tornado una decision correcta. 

Debido a que estamos poniendo en practica una prueba de dos colas, el valor p = 2P (t > 
4.375). De los valores contenidos en la Tabla 5, Apendice 3, se deduce que P (t > 4.375) < 

Tabla 11.3 Datos para el Ejemplo 11.8 

Calificacion del examen 

de conocimientos Calificacion final 


Estudiante 

matematicos 

de calculo 

1 

39 

65 

2 

43 

78 

3 

21 

52 

4 

64 

82 

5 

57 

92 

6 

47 

89 

7 

28 

73 

8 

75 

98 

9 

34 

56 

10 

52 

75 
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.005. Entonces el valor p < 2(.005) = .010 y para cualquier valor de a mayor que .01 (in- 
cluyendo a = .05, como se usa en la parte inicial de este analisis), podnamos concluir que 
p =f= 0. La aplicacion Student's t Probabilities and Quantiles, usada con 8 grados de libertad, 
da ese valor p = 2 P (t > 4.375) = 2(.00118) = .00236, un valor considerablemente menor 
que el lfinite superior para el valor p que se obtuvo usando la Tabla 5. ■ 


Observe que el cuadrado del coeficiente de correlacion se presenta en el denominador del 
estadfstico t usado para realizar la prueba de las hipotesis en el Ejercicio 11.8. El estadfsti- 
co r se denomina coeficiente de determinacion y tiene una interpretacion interesante y util. 
Originalmente (Section 11.3), definimos la suma de cuadrados del error (SSE) como la suma 
de los cuadrados de las diferencias entre los valores observado y pronosticado de las v ; , 

n n 

sse = ~ yt ) 2 = !>'■ “ (A> + $ixdf. 

i=l i=l 


Si el modelo de regresion lineal simple se ajusta bien a los datos, las diferencias entre los 
valores observado y pronosticado son pequenas, lo cual lleva a un valor pequeno para la SSE. 
De igual manera, si el modelo de regresion se ajusta mal, la SSE sera grande. En el Ejercicio 
11.15 usted demostro que una ecuacion comoda desde el punto de vista computacional para 
SSE es 


SSE = Syy - /S 1 S X y, 


donde /3j 



Con el uso de esta expresion fue facil demostrar (Ejercicio 11.15(b)) que SSE < 5 La can- 
tidad Syy = XX) 7 / — y) 2 proporciona una medida de la variation total entre los valores y, 
pasando por alto las x. De manera alternativa, la SSE mide la variation en los valores y que 
permanecen sin explication despues de usar las x para ajustar el modelo de regresion lineal 
simple. Entonces, la razon SSE/.S’, , da la proportion de la variation total en las y ; que no es 
explicada por el modelo de regresion lineal. 

Observe que el coeficiente de determinacion se puede escribir como 

S X y \ _ / $xy \ / S xy \ / /31 $xy 

\/S XX Syy J \ S xx J \ Syy J y Syy 

Asi, r se puede interpretar como la proporcion de la variacion total en las y, que es explicada 
por la variable x en un modelo de regresion lineal simple. 



Syy — SSE SSE 

Syy Syy 


EJEMPLO 11.9 Consulte el Ejemplo 11.8 donde calculamos el coeficiente de correlacion entre las calificacio- 
nes del examen de conocimientos matematicos y las calificaciones finales de calculo, para diez 
estudiantes de primer ano de universidad seleccionados de manera independiente. Interprete 
los valores del coeficiente de correlacion y el coeficiente de determinacion. 

Solution En el Ejemplo 11.8 obtuvimos r = .8398. Como r es positiva, concluimos que los estudiantes 
de primer ano de universidad con mas altas calificaciones en el examen de conocimientos 
tienden a obtener mas altas calificaciones en calculo. El coeficiente de determinacion es r = 
(.8398) 2 = .7053. Entonces, 70.53% de la variacion en las calificaciones finales de calculo se 
explica al ajustar el modelo lineal simple usando las calificaciones de conocimientos matema¬ 
ticos como la variable independiente. El modelo de regresion funciona muy bien. ■ 
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Ejercicios 

11.48 La siguiente tabla muestra la carga pico de potencia para una planta generadora de energfa electrica y la 
temperature alta diaria para una muestra aleatoria de 10 dfas. Pruebe la hipotesis de que el coeficiente de 
correlacion poblacional p, entre la carga pico de potencia y la temperature alta, es cero contra la hipote¬ 
sis alternativa de que sea positivo. Use a = .05. Limite o determine el nivel de significancia alcanzado. 


Dfa 

Temperature alta (°F) 

Carga pico 

1 

95 

214 

2 

82 

152 

3 

90 

156 

4 

81 

129 

5 

99 

254 

6 

100 

266 

7 

93 

210 

8 

95 

204 

9 

93 

213 

10 

87 

150 


11.49 Ejercicio Applet Consulte el Ejemplo 1 1.1 y el Ejercicio 11.2. Entre ala aplicacion Fitting a Line Using 
Least Squares. Los datos que aparecen en la primera grafica son del Ejemplo 11.1. 

a Arrastre la recta azul para obtener una ecuacion que visualmente se ajuste bien a los datos. ^Que 
observa acerca de los valores de la SSE y t 2 cuando mejora el ajuste de la recta? ^Por que r 2 aumenta 
cuando la SSE disminuye? 

b Haga clic en el boton “Find Best Model” para obtener la recta de rmnimos cuadrados. ^Cual es el 
valor de r 2 ? ^Cual es el valor del coeficiente de correlacion? 

11.50 Ejercicio Applet Consulte los Ejercicios 11.5 y 11.6. Los datos del Ejercicio 11.5 aparecen en la grafica 
bajo el encabezado “Another Example” en la aplicacion Fitting a Line Using Least Squares. 

a Arrastre la recta azul para obtener una ecuacion que visualmente se ajuste bien a los datos. ^Que 
observa acerca del valor de r 2 cuando mejora el ajuste de la recta? 
b Haga clic en el boton “Find Best Model” para obtener la recta de mmimos cuadrados. ^Cual es el 
valor de r 2 ? ^Cual es el valor del coeficiente de correlacion? 
c ^Por que el valor de t 2 es mucho mas grande que el valor de r 2 obtenido en el Ejercicio 11.49(b) que 
utilizo los datos del Ejemplo 11.1? 

11.51 En el Ejercicio 11.8 los valores LC50 de flujo y estatico podrfan considerarse variables aleatorias. 
Usando los datos del Ejercicio 11.8 haga una prueba para ver si la correlacion entre valor estatico y de 
flujo difieren significativamente con respecto a cero. Use a = .01. Limite o determine el valor p asocia- 
do. 

11.52 ^La densidad de plantas de una especie esta relacionada con la altitud a la que se recolectan los datos? 
Denote con Y la densidad de especie y con X la altitud. Un ajuste de un modelo de regresion lineal simple 
que uso 14 observaciones dio como resultado y = 21.6 — 7.79* y r 2 = .61. 

a ^Cual es el valor del coeficiente de correlacion r? 

b ^Que proportion de la variation en las densidades es explicada por el modelo lineal que usa la altitud 
como la variable independiente? 

c ^Hay suficiente evidencia en la a = .05 para indicar que las densidades de plantas disminuyen con 
un aumento en la altitud? 
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11.53 El coeficiente de correlation para las estaturas y pesos de diez jugadores ofensivos de futbol americano 
se determinaron como r = .8261. 

a ^Que porcentaje de la variation en los pesos se explico por las estaturas de los jugadores? 
b ^Que porcentaje de la variation en las estaturas se explico por los pesos de los jugadores? 
c i,Hay suficiente evidencia en el nivel a — .01 para decir que estaturas y pesos estan correlacionados 
positivamente? 

d Ejercicio Applet (i Cual es el nivel de significancia alcanzado y que esta asociado con la prueba efec- 
tuada en el inciso c? 

11.54 Suponga que buscamos un estimador intuitivo para 

Cov(A, Y) 

P = -• 

Ox ay 


a El estimador del metodo de momentos de Cov(X, Y) = E [(A - p, z )(F - pi y )] es 

WX?Y) = - Y(X, - A)(F, - F). 

" U 


Demuestre que los estimadores del metodo de momentos para las desviaciones estandar de X y Y son 


Ox = . 


It™-*? 


y oy 




b Sustituya los estimadores por sus parametros respectivos en la definition de p y obtenga el estimador 
del metodo de momentos para p. Compare su estimador con r, el estimador de maxima probabilidad 
para p presentado en esta section. 

11.55 Considere el modelo de regresion lineal simple basado en la teorfa normal. Si estamos interesados en 
probar H 0 : fi l = 0 contra varias alternativas, el estadlstico 

T = fii-o 

s/x/SZ 


tiene una distribution t con n — 2 grados de libertad si la hipotesis nula es verdadera. Demuestre que la 
ecuacion para T tambien se puede escribir como 

rVn - 2 

T = 


11.56 Consulte el Ejercicio 11.55. ^Es r = .8 suficientemente grande para decir que p > 0 en el nivel de sig¬ 
nificancia a = .05? 

a Suponga n = 5 y realice la prueba. 
b Suponga n = 12 y realice la prueba. 

c Ejercicio Applet Determine los valores p para las pruebas que llevo a cabo en los incisos a y b. 
d ^Llego usted a las mismas conclusiones en los incisos a y b? ^Por que si o por que no? 
e ^Por que el valor p asociado con la prueba del inciso b es mucho menor que el valor p asociado con 
la prueba efectuada en el inciso a? 

11.57 Consulte los Ejercicios 11.55 y 11.56. 

a ^Que termino en el estadlstico T determina si el valor de t es positivo o negativo? 
b ^Que cantidades determinan el tamano de |f|? 

11.58 Consulte el Ejercicio 11.55. Si n = 4, ^cual es el mmimo valor de r que permitira concluir que p > 0 en 
el nivel de significancia a = .05? 
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11.59 Consulte los Ejercicios 11.55 y 11.58. Si n = 20, ^cual es el maximo valor de r que permitira concluir 
que p < 0 en el nivel de significancia a = .05? 

*11.60 Consulte los Ejercicios 11.8 y 11.51. Suponga que pruebas independientes, con los mismos toxicos 
y especies pero en diferente laboratorio, demostraron que r = .85 con n = 20. Pruebe la hipotesis de 
que los dos coeficientes de correlation entre mediciones estatica y de flujo de LC50 son iguales. Use 
a = .05. 


11.9 Algunos ejemplos practicos 

En esta section presentamos dos ejemplos que ilustran la aplicabilidad de tecnicas previamen- 
te desarrolladas a datos reales. Casi todos los metodos estan ilustrados en algun punto en el 
curso del analisis. No intentamos aplicar todos los metodos para cada ejemplo. 


EJEMPLO 11.10 


En su tesis de doctorado, H. Behbahani examino el efecto de hacer variar la proportion de 
agua y cemento en la resistencia del concreto despues de 28 dfas. Para el concreto con un 
contenido de cemento de 200 libras por yarda ciibica, obtuvo los datos presentados en la Tabla 
11.4. 9 Sea Fla resistencia y x la proportion de agua y cemento. 

a Ajuste el modclo E( Y) = /3 0 + /3,x. 

b Pruebe H 0 : /3 l = 0 contra H a : /3 , < 0 con a = .05. (Observe que si H 0 es rechazada con- 
cluimos que [3 l < 0 y que la resistencia tiende a disminuir con un aumento en la proportion 
de agua y cemento.) Identifique el correspondiente nivel de significancia alcanzado. 
c Encuentre un intervalo de confianza de 90% para la resistencia esperada del concreto cuan- 
do la proportion de agua y cemento sea de 1.5. ( ,Quc le ocurrira al intervalo de confianza 
si tratamos de calcular resistencias medias para proporciones de agua y cemento de .3 o 
2.7? 


Solution a Usando las formulas desarrolladas en la Section 11.3 obtenemos 

n n 

' v; = 8.709 - 


Syv ~ 


~ \ X> = 8 - 709 ~ ^(8.74X6.148) = 


= -.247, 


1=1 


i=l i' = l 
2 


Sxx ~ 


S vv — 


Vr - - (V xA = 12.965 - -(8.74) 2 = .234, 

h n \h ) 6 

(§ J/ ) = 6569 ~ ^ (6 - 148)2 = - 269 ’ 


Pi = -r L = 


-0.247 

0.234 


= -1.056, 


6.148 / 8.74 \ 

P 0 =y-I3ix = — - (-1.056) l — | = 2.563. 


(En todo este ejemplo, todos los calculos se hacen a tres lugares decimales.) 


9. Fuente : datos adaptados de la obra de Hamid Behbahani, “Econocrete—Design and Properties” (tesis para Ph.D., 
University of Florida, 1977), p. 95. 
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Tabla 11.4 Datos para el Ejemplo 11.10 


Proportion de agua y cemento 

Resistencia (100 ft/lb) 

1.21 

1.302 

1.29 

1.231 

1.37 

1.061 

1.46 

1.040 

1.62 

.803 

1.79 

.711 


Por tanto, el modelo de li'nea recta que mejor se ajusta a los datos es 


y = 2.563 - 1.056*. 


b Debido a que deseamos probar si hay evidencia de que fi l < 0 con a = .05, el estadfstico 
de prueba apropiado es 

y 8 i -0 &-0 

t = —— — ■ o t = 


S y/cn 

Para este modelo de regresion lineal simple, 

SSE = S yy ~ PiS xy = .269 - (-1.056X-.247) = .008, 


y, por tanto, 



Entonces, el valor del estadfstico de prueba apropiado para probar H 0 : P l = 0 contra H a : 
Pi< 0 es 


-1.056 -0 

.045 vT 7 c 23 ly 


-11.355. 


Como este estadfstico esta basado en n - 2 grados de libertad y la region de rechazo apro- 
piada es t < -t 05 = -2.132, rechazamos H 0 a favor de H a en un nivel de significance de 
a = .05. La prueba apropiada es una prueba de cola inferior, y valor p = P (t < -11.355), 
donde t tiene una distribution t con 4 grados de libertad. La Tabla 5, Apendice 3, se aplica 
para dar un valor p < .005. De hecho la aplicacion Student' 1 Probabilities and Quantiles 
proporciona un valor p = P (t< -11.355) = P (t> 11.355) = .00017, valor considerable- 
mente menor que .005. En consecuencia, para los valores de a que mas se usan, concluimos 
que hay evidencia para indicar que la resistencia disminuye con un aumento en la propor¬ 
tion de agua y cemento en la region donde el experimento fue realizado. Desde un punto 
de vista practico, la proportion de agua y cemento debe ser lo suficientemente grande para 
humedecer el cemento, la arena y otros componentes que conforman el concreto. Pero si la 
proportion de agua y cemento se hace demasiado grande, el concreto sera inutil, 
c Debido a que estamos usando un modelo de regresion lineal simple, el intervalo de confian- 
za puede obtenerse de la formula 


/So + P\X* ± tafiS 


M + (x* -x) 2 
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Buscamos un intervalo de confianza cuando x = 1.5; por tanto, x* = 1.5 y 
00 + 0\x* = 2.563 - (1.056)(1.5) = .979. 

Usando calculos de los incisos a y b, obtenemos el intervalo de confianza de 90% de- 
seado: 

(1.5 - 1.457) 2 

.979 ±(2.132)(.045)y / - + --—-- o (.938,1.020). 

Entonces, estimariamos que la resistencia media del concreto con una proporcion de agua y 
cemento de 1.5 estarfa entre .938 y 1.020. 

De la expresion de varianza podemos ver que el intervalo de confianza se hace mas ancho 
cuando x* se aleja de x = 1.457. Tambien, los valores x* = .3 y x* = 2.7 estan lejos de los 
valores que se usaron en el experimento. Debe tenerse sumo cuidado antes de construir un 
intervalo de confianza para E(Y) cuando los valores de x* estan muy lejos de la region expe¬ 
rimental. Es muy probable que las proporciones de agua y cemento de .3 y 2.7 produzcan un 
concreto que sea inutil por completo. ■ 


En muchas situaciones practicas, el componente determimstico mas apropiado de un mo- 
delo no es lineal. Por ejemplo, un gran numero de poblaciones de plantas o animales tienden 
a crecer a ritmos exponenciales. Si Y t denota el tamano de la poblacion en el tiempo I. podrfa- 
mos emplear el modelo 

E(Y t ) = a 0 e ai '. 

Aun cuando esta expresion no es lineal en los parametros a 0 y aq, se puede hacer lineal si 
se aplican logaritmos naturales. Si Y, se puede observar para diversos valores de t, podemos 
escribir el modelo como 


In Y t = In «o + oi\ t + e 

y estimar In a 0 y aq por el metodo de mfnimos cuadrados. 

Otros modelos basicos tambien se pueden hacer lineales. En las ciencias biologicas en 
ocasiones es posible relacionar el peso (o volumen) de un organismo con respecto a alguna 
medicion lineal como la longitud (o el peso). Si W denota el peso y / la longitud, a menudo se 
aplica el modelo 

E(W) = ctol ai 

para a 0 y aq desconocidas. (Este modelo se conoce como ecuacion alometrica.) Si deseamos 
relacionar el peso de organismos seleccionados al azar con longitudes fijas observables, pode¬ 
mos aplicar logaritmos y obtener el modelo lineal 

In W = In ao + a \ In l + e = A) + Pi x + e 

con x = In /. Entonces, [3 0 = In a 0 y (3 l = a, se pueden estimar por el metodo de mfnimos 
cuadrados. El siguiente ejemplo ilustra ese modelo. 


EJEMPLO 11.11 Enel conjunto de datos de la Tabla 11.5, W denota el peso (en libras) y / la longitud (en pul- 
gadas) de 15 lagartos capturados en la region central de Florida. Debido a que / es mas facil 
de observar (quiza de una fotograffa) que W para lagartos en su habitat natural, buscamos 






Solucion 
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Tabla 11.5 Datos para el Ejemplo 11.11 


Lagarto 

x = In/ 

y = In W 

1 

3.87 

4.87 

2 

3.61 

3.93 

3 

4.33 

6.46 

4 

3.43 

3.33 

5 

3.81 

4.38 

6 

3.83 

4.70 

7 

3.46 

3.50 

8 

3.76 

4.50 

9 

3.50 

3.58 

10 

3.58 

3.64 

11 

4.19 

5.90 

12 

3.78 

4.43 

13 

3.71 

4.38 

14 

3.73 

4.42 

15 

3.78 

4.25 


construir un modelo que relacione peso con longitud. Ese modelo se puede usar entonces para 
predecir los pesos de lagartos de longitudes especificadas. Ajuste el modelo 

In W = In ao + ai In / + e = /So + fi\x + s 

a los datos. Encuentre un intervalo de prediction de 90% para W si se observa que In / es 4.00. 


Empezamos por calcular las cantidades que tienen aplicacion de rutina en toda nuestra solu¬ 
cion: 


S xv = 


Srx ~ 


n j n n ^ 

~ ~ J2 x i = 251.9757 - —(56.37X66.27) = 2.933, 

1=1 i =1 i =1 

" i / » \ 2 i 

^xf - - I Y^ x i ) = 212.6933 - —(56.37) 2 = 0.8548, 

/=i n \i=l / ^ 


S yy = ) = 303.0409 - ^(66.27) 2 = 10.26, 


1=1 


<i = 1 


J8i = 


2.933 

0.8548 


= 3.4312, 


66.27 / 56.37\ 

= y - Pi x = — - (3.4312) I-— J = -8.476. 

Podemos ahora calcular a 0 con 

do = e^° = e %A16 = .0002 
y a l con cfei = /3 1 para llegar al modelo estimado 

w = d 0 /“' = (.0002)/ 3 - 4312 . 


(En muchos casos sera cercano a 3 porque peso o volumen es aproximadamente proporcio- 
nal al cubo de una medicion lineal.) 
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Para estos datos, SSE= .1963 ,h = 15 y s = VSSE/(« - 2) = .123. Los calculos que llevan 
a esos valores numericos son analogos por completo a los del Ejemplo 11.10. 

Para hallar un intervalo de prediccion para W, donde x = In / = 4. primero debemos formar 
un intervalo de prediccion para Y = In W. Como antes, el intervalo de prediccion es 

~ - * / 1 ( x * — x) 1 

0o + 0\x ± t,o 5 S 1 + - +---, 

V n S xx 


donde t 05 esta basada en n-2 = 13 grados de libertad. Por tanto, t 05 = 1.771 y el intervalo de 
prediccion de 90% para Y = In W es 


o bien, 


-8.476 +3.4312(4) 
5.2488 


1.771 (. 123) 
.2321, 


1 (4 - 3.758) 2 

1 + — +- 

15 .8548 


(5.0167, 5.4809). 

Como Y = In W, podemos predecir W con e Y = e 52488 = 190.3377. El intervalo de predic¬ 
cion de 90% observado para W es 

(e 50167 , g 54809 ), o (150.9125, 240.0627). 

Cuando x = In / = 4, entonces I = e 4 = 54.598. Entonces, para un lagarto de 54.598 pul- 
gadas de largo, predecimos que su peso estara entre 150.91 y 240.06 libras. El intervalo rela- 
tivamente estrecho en la escala de logaritmos naturales se hace un intervalo mas bien ancho 
cuando se transforma a la escala original. ■ 


Los datos presentados y analizados en esta seccion son ejemplos tornados de experimentos 
reales; los metodos desarrollados en secciones previas de este capftulo se aplicaron para pro- 
ducir respuestas de interes real para experimentadores. A lo largo del Ejemplo 11.11 hemos 
demostrado la forma en que la teorfa de modelos lineales a veces se puede aplicar despues 
de la transformacion de la escala de las variables originales. Desde luego que no todos los 
modelos se pueden hacer lineales, pero existen numerosas tecnicas para calcular mmimos 
cuadrados no lineales. 


Ejercicios 

11.61 Consulte el Ejemplo 11.10. Encuentre un intervalo de prediccion de 90% para la resistencia del concreto 
cuando la proporcion de agua y cemento sea 1.5. 

11.62 Consulte el Ejercicio 11.11. Calcule el coeficiente de correlation r entre las variables In W y In I. gQue 
proporcion de la variation en y = In w esta explicada por x = In /? 

*11.63 Es bien sabido que grandes cuerpos de agua tienen un efecto mitigador en la temperatura de las masas 
de tierra circundantes. En una noche frfa en la region central de Florida se registraron temperaturas a 
distancias iguales a lo largo de una zona que coma a favor del viento desde un lago de grandes dimen- 
siones. Los datos resultantes se dan en la siguiente tabla. 
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Lugar ( x ) 

Temperature °F, (y) 

1 

37.00 

2 

36.25 

3 

35.41 

4 

34.92 

5 

34.52 

6 

34.45 

7 

34.40 

8 

34.00 

9 

33.62 

10 

33.90 


Observe que las temperaturas bajan rapidamente y luego se nivelan cuando nos alejamos del lago. El 
modelo sugerido para estos datos es 


E{Y) = a 0 e~ a ' x . 

a Convierta el modelo en uno lineal y calcule los parametros por medio del metodo de mmimos cua- 
drados. 

b Encuentre un intervalo de confianza de 90% para cr 0 . Interprete el resultado. 

*11.64 Consulte el Ejercicio 11.14. Un modelo propuesto para estos datos sobre la proporcion de sobrevivientes 
a la contaminacion termica es 

E(Y) = exp( — a 0 x a '). 

Linealice este modelo y estime los parametros con el metodo de mmimos cuadrados y los datos del 
ejercicio 11.14 (ignore la observacion cony = 1.00) 

*11.65 En las ciencias biologicas y fisicas un modelo comun para el crecimiento proporcional en el tiempo es: 

E{Y) = 1 — e~P', 

donde Y denota una proporcion y t denota tiempo. Y podrfa representar la proporcion de huevos que empo- 
llan, la proporcion de un organismo lleno de celulas enfermas, la proporcion de pacientes que reaccionan a 
un medicamento o la proporcion de un llquido que ha pasado por un medio poroso. Con n observacio- 
nes de la forma (y ; , t,), haga un resumen de la forma en que calcularfa y luego formarfa un intervalo de 
confianza para /3. 


11.10 Ajuste del modelo lineal mediante matrices 

Hasta este punto en este capftulo hemos trabajado en forma casi exclusiva con modelos de re¬ 
gresion lineal simple , que han hecho posible que expresemos nuestras deduccciones y resulta- 
dos usando expresiones algebraicas ordinarias. La unica forma practica de manejar resultados 
y deducciones analogos para modelos de regresion lineal multiple es por medio de algebra de 
matrices. En esta seccion usamos matrices para expresar de otro modo algunos de los resulta¬ 
dos anteriores y ampliar estos resultados al modelo de regresion lineal multiple. 

Suponga que tenemos el modelo lineal 


Y - Po + + ' ' ’ + PkXk + e 
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y hacemos n observaciones independientes, y v y 2 ,..., y n , en Y. Podemos escribir la observa¬ 
tion y t como 

yi = Po + PiXn + PlXil d-+ PkXik + 

donde x- es el ajuste de lay-esima variable independiente para la i-esima observation, 1=1, 
2,... ,n. Ahora definimos las siguientes matrices con x 0 = 1: 



y i 


Xo 

Xll 

Xl2 ■ 

■ Xu 

Y = 

yi 

, x = 

x 0 

X21 

X22 ■ 

■ X2k 


.y„. 


- x 0 

X„1 

X n 2 

‘ X n k _ 


r A.’ 


~Si ' 




P = 

/3i 

, € = 

B2 





-Pk- 


.B n . 





Entonces, las n ecuaciones que representan v, como funcion de las x, las ^ y las e se pueden 
escribir simultaneamente como 


Y = X/3 + e. 

(En el Apendice 1 vease una exposition de las operaciones con matrices.) 
Para n observaciones desde un modelo lineal simple de la forma 


Y = (3 0 + p r x + e. 



‘>'1 ' 


■ l 

x\ ' 


‘fit " 

Y = 

y2 

, x = 

l 

X2 

, 6 = 

B2 


-y n . 


. l 

X n . 


- &n - 


p = 


A) 

A 


(Suprimimos el segundo subindice en x porque solo aparece una variable x.) Las ecuaciones 
de mmimos cuadrados para [3 (l y (3 i se dieron en la Section 11.3 como 


n n 

n$ 0 + /3, YXi = 

i =1 i = 1 

n n n 

A) Y x ‘ + p' = J2 Xiy ‘- 

i=t ;=i ;=i 


Como 


XX = 


1 1 

Xi x 2 


l 

X \' 


l 

X2 





.1 

Xn - 



n J2 x i 
1=1 

n n 

Ex, E *, 2 

i=\ i =1 
























EJEMPLO 11.12 
Solucion 
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.y> 

i 

xiyi 


vemos que las ecuaciones de mi'nimos cuadrados estan dadas por 

(X'X)jS = X'Y. 

Por tanto, 

0 = (X'X) _1 X'Y. 

Aun cuando hemos demostrado que este resultado se cumple para un caso simple, se puede 
demostrar que en general las ecuaciones de mmimos cuadrados y las soluciones presentadas 
en notation matricial son las siguientes. 


si 


X'Y = 


5 


£ 

i=] 


P = 


Ecuaciones de mi'nimos cuadrados y soluciones para un modelo lineal general 

Ecuaciones: (X'X)/3 = X'Y. 

Soluciones: 0 = (X'X) _I X'Y. 


Resuelva el Ejemplo 11.1 usando operaciones matriciales. 


De los datos dados en el Ejemplo 11.1 vemos que 


Se deduce que 

XX 


Por tanto, 


o 0o — i y 0i 


x 0 X\ 


-o- 


- 1 -2- 

0 


1 -1 

1 

II 

1 0 

1 


1 1 

.3. 


. 1 2. 


5 0 

0 10 



(X'X) 1 


1/5 

0 


0 = (X'X) *X'Y 
.7. Entonces, 


'1/5 

0 

'5' 


' 1 ' 

0 

1/10 

7 


.7 


y = 1 + .lx. 


0 

1/10 


igual que en el Ejemplo 11.1. 
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EJEMPLO 11.13 Ajuste una parabola a los datos del Ejemplo 11.1 usando el modelo 

Y = Po + Pi x + Pi * 2 + e. 

Solucion La matriz X para este ejemplo difiere de la del Ejemplo 11.12 solo por la adicion de una ter- 
cera columna correspondiente a x 2 . (Observe que x 1 = x, x 2 = x 2 y k = 2 en la notacion del 
modelo lineal general.). Entonces, 



Xo 

X 

x 2 

-o- 


1 

-2 

4- 

0 


1 

-1 

1 

1 

X = 

1 

0 

0 

1 


1 

1 

1 

.3. 


.1 

2 

4. 


(Las tres variables, x 0 , x y x 2 , se muestran arriba de sus columnas respectivas en la matriz X.) 
Por tanto, para la primera medicion, y = 0, x 0 = 1, x= —2 yr = 4; y para la segunda medi- 
cion, y = 0,x 0 = 1, x = — I y x 2 = 1. Las filas sucesivas de las matrices Y y X se obtienen de 
un modo semejante. 

Los productos matriciales X'X y X'Y son 


r 1 -2 4i 



- 1 

1 

1 

1 

1- 


1 

-1 

1 


- 5 

0 

10- 

X'X = 

-2 - 

1 

0 

1 

2 


1 

0 

0 

= 

0 

10 

0 


. 4 

1 

0 

1 

4. 


1 

1 

1 


.10 

0 

34. 


L 1 2 4J 



-o- 


- 1 1111- 


0 


- 5 - 

-2-1012 


1 

= 

7 

.4 10 14. 


1 


.13. 


.3. 



Omitimos el proceso de invertir X'X y simplemente expresamos que la matriz inversa es igual a 


(X'X) 


-17/35 0 —1/7" 

0 1/10 0 

.-1/7 0 1/14. 


[Usted puede verificar que (X'Xy'X'X = I.] 
Finalmente, 

0 = (X'X) _1 X'Y 


-17/35 

0 

— 1/71 

- 5 - 


[4/7 -1 


-.571- 

0 

1/10 

0 

7 

= 

7/10 


.700 

L—1/7 

0 

1/14 . 

.13. 


.3/14. 


..214. 


Por tanto, 0 O = .571, /3 1 = .7 y 02 = .214, y la ecuacion de prediccion es 


y = .571 + .lx + .214jc 2 . 


Una grafica de esta parabola en la Figura 11.6 indicara un buen ajuste para los puntos. 
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Las expresiones para V(/3o), Cov(/3o, fi\), asf como SSE que dedujimos en la 

Seccion 11.4 para el modelo de regresion lineal simple, se pueden expresar de manera con- 
veniente en terminos de matrices. Hemos visto que para el modelo lineal Y = /3 0 + (i v x + e, 
X'X esta dado por 


XX = 


.E x i 


£*/ " 

X>, 2 - ’ 


Se puede demostrar que 


(X'X) 


' T, x f 

ft Sxx $xx 

X 1 

$xx $xx 


c oo 

Coi 

Cio 

Cll 


Si se verifican las varianzas y las covarianzas derivadas en la Seccion 11.4, podemos ver que 


V(Pi) = cacr 2 , i= 0,1 

y 

Cov(/3 0 ,/3i) = coicr 2 = ciocr 2 . 

Recuerde que un estimador insesgado para cr 2 , la varianza del termino de error e, esta dado 
por S 2 = wSSE/(n - 2). Un poco de algebra de matrices demostrara que SSE= ^2(y, — y ,-) 2 
se puede expresar como 

SSE = Y'Y — P'X'Y. 

(Observe que Y'Y = J2 Yf .) 


EJEMPLO 11.14 Determine las varianzas de los estimadores ySo y /3 1 para el Ejemplo 11.12 y proponga un 
estimador para cr 2 . 


Solucion En el Ejemplo 11.12 encontramos que 


(X'X) 


1/5 0 

0 1/10 


Por tanto, 

V(/3 0 ) = cqqct 2 = (l/5)cr 2 , 
V(/3i) = Cncr 2 = (l/10)cr 2 . 


A1 igual que antes, Cov(/3q, $i) =0 en este caso porque x i = 0. Para estos datos, 


- 0 ■ 


’1 

— 2 " 

0 


1 

-1 

1 

, x = 

1 

0 

1 


1 

1 

. 3 . 


-1 

2 - 


$ = 


1 

.7 
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En consecuencia. 


SSE = Y'Y - jS'X'Y 


Entonces, 


= [0 0 113 ] 


= 11 - [ 1 - 7 ] 


-[1 - 7 ] 


= 11 -9.9 = 1.1. 


1 1 

-1 0 


SSE _ 1.1 _ 1.1 
n-2 ~ 5-2 ~~ ~3~ 


.367. 


1 1 
1 2 


-o- 

0 

1 

1 

.3. 


Observe la correspondencia con los resultados que se obtuvieron en los Ejemplos 11.2 y 

11.3. ■ 


Ejercicios 

11.66 Consulte el Ejercicio 11.3. Ajuste el modelo sugerido aplicando matrices. 

11.67 Use el metodo de matrices para ajustar una recta a los datos de la siguiente tabla, grafique los puntos y 
luego trace la recta ajustada como prueba de los calculos. Los datos son los mismos de los Ejercicios 
11.3 y 11.66 excepto que estan recorridos 1 unidad en la direction positiva a lo largo del eje x. iQue 
efecto tiene la separation simetrica en los valores x alrededor de x = 0 sobre la forma de la matriz (X'X) 
y los calculos resultantes? 


y 

X 

3 

-1 

2 

0 

1 

l 

1 

2 

.5 

3 


11.68 Ajuste el modelo cuadratico Y = /3 0 + fi t x + fi^x 1 + e a los datos de la tabla siguiente. Localice los 
puntos y trace la parabola ajustada como prueba de los calculos. 


y 

X 

l 

-3 

0 

-2 

0 

-1 

-l 

0 

-l 

1 

0 

2 

0 

3 
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11.69 El fabricante de autos Lexus ha aumentado continuamente sus ventas desde el lanzamiento de esa marca 
en 1989 en Estados Unidos. No obstante, el porcentaje de aumento cambio en 1996 cuando el Lexus in- 
trodujo una lfnea de camiones. Las ventas de vehfculos Lexus de 1996 a 2003 se muestran en la siguiente 
tabla. 10 


X 

7 

1996 

18.5 

1997 

22.6 

1998 

27.2 

1999 

31.2 

2000 

33.0 

2001 

44.9 

2002 

49.4 

2003 

35.0 


11.70 


a Denotando con Y las ventas y con x el ano cifrado (-7 para 1996, -5 para 1997, hasta 7 para 2003), 
ajuste el modelo Y = yS 0 + PiX + s. 
b Para los mismos datos, ajuste el modelo Y = /3 0 + ji\X + f3 2 x 2 + s. 
a Calcule SSE y S 2 para el Ejercicio 11.4. Use el metodo de matrices. 

b Ajuste el modelo sugerido en el Ejercicio 11.4 para la relation entre valores auditados y valores en 
libros usando matrices. Podemos simplificar los calculos si definimos 


x * — Xi — x 

y ajustando el modelo Y — /3q + f$\x* +s, Adecue este ultimo modelo y calcule la SSE. Compare su 
respuesta con el calculo de la SSE del inciso a. 


11.11 Funciones lineales de los parametros 
del modelo: regresion lineal multiple 

Todos los resultados teoricos de la Section 11.4 se pueden ampliar al modelo de regresion 
lineal multiple, 

Yi /3o 4~ f$\Xn 4" * • ■ PkXik £/, i 1,2,...,/?. 

Suponga que e 1? e 2 ,..., s n son variables aleatorias independientes con E («,) = 0 y V (e ; ) = a 2 . 
Entonces los estimadores de mmimos cuadrados estan dados por 

f3 = (X'X) _1 X'Y, 

siempre que (X'X) exista. Las propiedades de estos estimadores son las siguientes (se omite 
la prueba). 


10. Fuente : adaptado de Automotive News, 26 de enero de 2004. 
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Propiedades de los estimadores de mmimos cuadrados: regresion lineal multiple 

1. E0i) =fr,i =0,1 . k. 

2. V(/3,•) = cacr 2 , donde c u es el elemento en la fila i y columna i de (X'X) -1 . 
(Recuerde que esta matriz tiene una fila y una columna numerados con 0.) 

3. Cov(j8,-, ft/) = Cijcr 2 , donde c kj es el elemento en la fila i y columna / de (X'X) *. 

4. Un estimador insesgado de cr 2 es S 2 = SSE/[n - (k + 1)], donde SSE = 
Y'Y — [3 X'Y. (Observe que hay k + 1 valores (3, desconocidas en el modelo.) 

Si, ademas, las e ; , para i = 1,2, ... ,n estan distribuidas normalmente, 

5. Cada /3, esta distribuida normalmente. 

6. La variable aleatoria 

[n-(k + 1)]S 2 
a 2 

tiene una distribucion con n - (k + 1) grados de libertad. 

7. Los estadfstico S 2 y /3, son independientes para cada i = 0, 1, 2,..., k. 


11.12 Inferencias respecto a funciones 

lineales de los parametros del modelo: 
regresion lineal multiple 


Como lo vimos en las Secciones 11.5 y 11.6, podrfamos estar interesados en hacer inferencias 
acerca de una /3, individual o de combinaciones lineales de los parametros del modelo (3 0 , 
(3 k . Por ejemplo, queremos estimar E(Y), dada por 

E(Y) = fio + /3i a'i H-+ fikXk, 

donde E(Y) representa la produccion media obtenida en un proceso qmmico para arreglos de 
variables de proceso controladas x u x 2 ,..., x k ; o la utilidad media de una empresa para diver¬ 
sos gastos de inversion x 1 ,x 2 ,..., x k . Las propiedades de los estimadores de estas funciones 
lineales se dan en esta seccion. 

Suponga que deseamos hacer una inferencia acerca de la funcion lineal 


«o/3o + aiPi + azPi H-+ akfik, 


donde a 0 , a x , a 2 , .... a k son constantes (algunas de las cuales pueden ser iguales a cero). 
Definiendo la matriz (k + 1) x 1, 

'a 0 ' 


a = 


a\ 

ai 


lau J 
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se deduce que una combinacion lineal de las f3 0 , , f3 k correspondiente a a 0 , a t ,.... a k se 

puede expresar como 

a'/3 = «oA) + a i0i + a 202 + ■ ■ • + a k (3 k . 

De aquf en adelante nos referiremos a esas combinaciones lineales en su forma matricial. 
Como a' /3 es una combinacion lineal de los parametros del modelo, un estimador insesgado 
para a' f3 esta dado por la misma combinacion lineal de los estimadores parametricos. Esto es, 
por el Teorema 5.12, si 

a '13 = «o/3o + a\(3\ + + ■ ■ • + d k 0 k = a'/3. 


entonces 

E(a'0) = E(d o 0 o + d\0\ + d202 + ■ ■ • + d k 0k) 

= «o/3o + a\f3\ + d 2@2 + • • ■ + d k (3k = a'/3. 

Aplicando el mismo teorema, encontramos la varianza de a' 0 : 

V(a'0) = V(ao0o + a\(3\ + ci202 + '' '+ a k 0 k ) 

= OqV (0o) + a 2 V(0\) + d\V {02) + ■ • • + a 2 k V(0 k ) 

+ 2a 0 fliCov(/3 0 , 0\) + 2aoa 2 Cow(0 o , 0 2 ) 

H-h 2aia 2 Cov(^i, 0 2 ) H-t- 2a k -id k Cov (0 k ~i, 0k), 

donde V(0j) = cao 2 y Cov (0,. 0,) = c,j(r 2 . listed puede verificar que Via(3) esta dada por 

V(a'0) = [a'(X'X) _1 a]o- 2 . 

Por ultimo, recordando que 0o, 0 1 • 02, ■ ■ ■, 0k estan distribuidas normalmente en muestreo 
repetitivo (Seccion 11 . 11 ), es evidente que a'0 es una funcion lineal de variables aleatorias 
distribuidas normalmente y por tanto ella misma esta distribuida normalmente en muestreo 
repetitivo. 

Debido a que a'0 esta distribuida normalmente con 

E(a0) = a'13 

y V(a'0 ) = [a'(X'X) _1 a]tr 2 , concluimos que 

7 _ a'0 - a'j3 _ a'0 - a' (3 

y V(a'j8) ^Va'(X'X)-‘a 

tiene una distribution normal estandar y podria emplearse para probar una hipotesis 

H 0 :a'/3 = (a'/3) 0 

cuando (a'/3) 0 es algun valor especificado. Del mismo modo, un intervalo de confianza de 
100(1 - a)% para a'(3 es 

a'/3 ± y/ a'(X'X) _1 a. 

Ademas, como podriamos sospechar, si sustituimos S por cr, la cantidad 

T = a'/3 - a'(3 

S^a'(X'X)- l a 
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tiene una distribucion f de Student en muestreo repetitive, con [n - (k +1)] grados de libertad, 
y proporciona un estadfstico de prueba para comprobar la hipotesis 

ff 0 :a'/3 = (a'/3) 0 . 


Una prueba para a'/3 


Ho-.a'P =(a'j8) 0 . 
a'/3 > (a'/3) 0 . 


H a : 


a' P < (a'/3) 0 , 


a'/3 ^ (a'/3) 0 . 

Estadistico de prueba: T 


a'jB - (a^jo 
Va'CX'X)-^' 


Region de rechazo: 


f > f a , 

f < -fa, 

|*| > fa/2- 


Aqui, t a esta basada en \n — (k + 1)] grados de libertad. 


El correspondiente intervalo de confianza 100(1 - a)% para a'/3 es el siguiente. 


Un intervalo de confianza 100(1 - a)% para a'/3 

a'/3 ± t a/2 Sy/ a^X'X)-^. 


Como ya vimos antes, la / ((/2 tabulada en esta formula esta basada en [n - ( k +1)] grados de 
libertad. 

Aunque por lo general no consideramos una /3, individual como una combinacion lineal de 
/3 0 , Pi,, P k , si escogemos 

11, si; = i, 

^ l0, si jfi, 

entonces /3, = a'/3 para esta seleccion de a. En el Ejercicio 11.71 usted demostrara que con 
esta seleccion de a, a'(X'X) 'a = c u , donde c„ es el elemento en la fila i y la columna i de 
(X'X) -1 . Este hecho simplifica enormemente la forma del estadistico de prueba y de los inter- 
valos de confianza que se puedan usar para hacer inferencias acerca de una [3 I individual. 

Como ya antes dijimos, una aplicacion util de las tecnicas de prueba de hipotesis e inter¬ 
valo de confianza que acabamos de presentar, es al problema de calcular el valor medio de Y, 
E ( Y) para valores fijos de las variables independientes x x , x 2 , . . . , x k . En particular, si x* 
denota un valor especifico de x h para i = 1,2 ,... ,k, entonces 

E(Y) = /3 0 + Pixl + p 2 x* 2 H-+ p k x* k . 

Observe que E(Y) es un caso especial de a Q l3 0 + a i p i + • • • + a k (3 k = a' ft con a 0 = 1 y 
a t = x* , para i = 1,2 , ... ,k. Entonces, una inferencia alrededor de E ( Y) cuando x, = x*, 
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EJEMPLO 11.15 


Solucion 


para i = 1, 2, . . . , k, se puede hacer usando las tecnicas desarrolladas para combinaciones 
lineales generales de las (3. 

Ilustramos esto con dos ejemplos. 


(-.Los datos del Ejemplo 11.1 presentan suficiente evidencia para indicar curvatura en la fun- 
cion de respuesta? Pruebe usando a = .05 y obtenga lfmites para el nivel de significancia 
alcanzado. 


La pregunta anterior supone que el modelo probabilfstico es una description realista de la 
respuesta verdadera e implica una prueba de la hipotesis H 0 : /3 2 = 0 contra H a : fi 2 =/= 0 en 
el modelo lineal Y = f3 0 + jSpt + (3 2 x 2 + e que se ajusto a los datos del Ejemplo 11.13. (Si 
/3 2 = 0, el termino cuadratico no aparecera y el valor esperado de Y representara una recta en 
funcion de x.) El primer paso en la solucion es calcular SSE y s 2 : 


SSE = Y'Y - /3'X'Y = 11 - [.571 


.700 


.214] 



asf que 


= 11 - 10.537 = .463, 


SSE 
n — 3 


.463 


.232 y 


s = .48. 


(Observe que el modelo contiene tres parametros y, por tanto, la SSE esta basada en n - 3 = 
2 grados de libertad.) El parametro [3 2 es una combination lineal de f3 0 , f3 l y (3 2 con a 0 = 0, 
flj = 0 y a 2 = 1. Para esta seleccion de a, tenemos = a'/3 y a'(X'X)~'a = c 22 . 

Los calculos en el Ejemplo 11.13 dan 0 2 = 3/14 ~ .214 y c 22 = 1/14. Por tanto, el esta- 
dfstico de prueba apropiado se puede escribir como 

B 2 -0 .214 

t = — - = - —— = 1.67. 

.48\/l/14 


Si tomamos a = .05, el valor de t a / 2 = t 025 para 2 grados de libertad es 4.303 y la region 
de rechazo es 


rechazar si \ t\ & 4.303. 

Como el valor absoluto del valor calculado de t es menor que 4.303, no podemos rechazar 
la hipotesis nula de que [i 2 = 0. No aceptamos H f) : (i 2 = i) porque necesitarfamos conocer la 
probabilidad de cometer un error tipo II —es decir, la probabilidad de aceptar erroneamen- 
te H 0 para un valor alternativo especificado de /3 2 — antes de que pudieramos tomar una 
decision estadfsticamente solida para aceptar. Debido a que la prueba es de dos colas, el 
valor p = 2P (t > 1.67), donde t tiene una distribucion t con 2 grados de libertad. Usando 
la Tabla 5, Apendice 3, encontramos que P (f > 1.67) > .10. Por tanto, concluimos que 
el valor p > .2. Mas precisamente, la aplicacion Student's 1 Probabilities and Quantiles 
se puede usar para establecer que el valor p = 2P (f > 1.67) = 2(. 11843) = .23686. A 
menos que estemos dispuestos a trabajar con un valor relativamente grande de a (al me- 
nos .23686), no podemos rechazar H 0 . De nuevo observamos la correspondencia entre las 
conclusiones alcanzadas por el procedimiento de prueba formal (a fija) y la interpretacion 
apropiada del nivel de significancia alcanzado. 
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Como un paso adicional en el analisis podrfamos observar el ancho de un intervalo de con¬ 
fianza para /3 2 para ver si es tan corto como para detectar una desviacion desde cero que sea de 
importancia practica. El intervalo de confianza de 95% resultante para [3 2 es 


$2 — t.025^\/C22- 


Sustituyendo, obtenemos 

.214 ± (4.303)(.48)^1/14, o .214 ± .552. 

Por consiguiente, el intervalo de confianza para /3 2 es bastante ancho, lo cual sugiere que el 
experimentador necesita recolectar mas information antes de tomar una decision ■ 


EJEMPLO 11.16 Para los datos del Ejemplo 11.1 encuentre un intervalo de confianza de 90% para E(Y) cuando 

x = 1. 

Solution Para el modelo del Ejemplo 11.1, 



«0 


T 

a — 

at _ 


X 


El intervalo de confianza buscado esta dado por 

a'j§ ± t a/ 2 Sy/a'(X'X)-'a. 
En el Ejemplo 11.12 determinamos que 


£ = 


y (X'X) = 


1/5 0 

0 1/10 


Como estamos interesados en x = 1, 


a = 


a'/j = [l l] 


= 1.7, 


a'(X'X) _1 a = [1 1] 


'1/5 

0 

T 

0 

1/10 

l 


= .3. 


En el Ejemplo 11.14 encontramos que s 2 es .367, o s = .606 para estos datos. El valor de 
t ()5 con n - 2 = 3 grados de libertad es 2.353 y el intervalo de confianza de 90% requerido 
para E(Y) esta dado por 

1.7 ± (2.353)(. 606) V/3, o 1.7 ± .781 


Nuestra respuesta aqui es la misma que se obtuvo en el Ejemplo 11.6 sin el uso de matri¬ 


ces. 
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11.71 


11.72 


11.73 


11.74 


Ejercicios 

Considere el modelo lineal general 

Y = ; 8 o + (i\X\ + f3 2X2 + ■ ■ ■ +f$i i Xi i + e. 


donde £(e) = 0 y E(e) = a 2 . Observe que /3, = a'/3, donde el vector a esta definido por 


1 , si j = i, 
0 , si jfi. 


Utilice este dato para verificar que E(j3,) = /3, y V(y 8 ,) = Cucr, donde c u es el elemento en la fila i y 
la columna i de (X'X) -1 . 

Consulte el Ejercicio 11.69. 

a i,Hay evidencia de un efecto cuadratico en la relacion entre Y y jc? (Pruebe H 0 : = 0.) Use 

a = .10. 

b Encuentre un intervalo de confianza de 90% para f) 2 . 

El experimentador que recolecto los datos del Ejercicio 11.68 afirma que el valor rninimo de E{Y) se 
presenta en x = 1. Pruebe esta afirmacion con un nivel de significancia de 5%. [Sugerencicv. E(Y) = 
/3 0 + (ipc + P 2 X 2 tiene su mrnimo en el punto x 0 , que satisface la ecuacion /3 1 + 2fi 2 x 0 = 0.] 

Se realizo un experimento para investigar el efecto de cuatro factores: temperatura T v presion P, catali- 
zador C y temperatura T 2 , en la produccion Y de una sustancia qufmica. 

a Los valores (o niveles) de los cuatro factores empleados en el experimento se muestran en la siguien- 
te tabla. Si cada uno de los cuatro factores se codifica para generar las cuatro variables jq, x 2 , x 2 y x 4 , 
respectivamente, indique la transformacion que relaciona cada variable codificada con su original 
correspondiente. 


T , 

Xl 

P 

x 2 

C 

*3 

t 2 

X 4 

50 

-1 

10 

-1 

1 

-1 

100 

-1 

70 

1 

20 

1 

2 

1 

200 

1 


b Ajuste el modelo lineal 


Y — fi 0 + P\X\ + P 2 X 2 + @ 3 X 3 + /S 4 JC 4 + e 


a la siguiente tabla de datos. 


x 4 



+1 

-1 

X 3 

X 3 

-1 

1 

-1 

1 


-1 

X 2 

-1 

22.2 

24.5 

24.4 

25.9 

Xl 



1 

19.4 

24.1 

25.2 

28.4 




-1 

22.1 

19.6 

23.5 

16.5 


+1 

X 2 

1 

14.2 

12.7 

19.3 

16.0 


c ^Los datos presentan suficiente evidencia para indicar que 7j contribuye con informacion para el 
calculo de Y7, iy P7, iy C7, ly T 2 7 (Pruebe las hipotesis, respectivamente, de que /3j = 0, /3 2 = 0, 
/ 8 3 = 0 y [3 4 = 0.) De llmites para el valor p asociado con cada prueba. ^Que concluirfa usted si utiliza 
a — .01 en cada caso? 
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11.75 Consulte el Ejercicio 11.74. Encuentre un intervalo de confianza de 90% para la production esperada, 
dado que T x = 50, P = 20, C = 1 y T 2 = 200. 

11.76 Los siguientes resultados se obtuvieron de un analisis de datos obtenido de un estudio para evaluar la 
relation entre porcentaje de aumento en rendimiento (F) y saturacion de base (jq, libras/acre), saturacion 
de fosfato ( x 2 , BEC%) y pH del suelo (x 3 ). Aleatoriamente se analizaron quince respuestas del estudio. 
A continuation aparece la ecuacion de mmimos cuadrados y otra information util. 


y = 38.83 -0.0092*! -0.92*2 + 11.56*3, 5^ = 10965.46, SSE = 1107.01, 


-15 1401.8 

2.6 

100.5 

-28 082.9- 

2.6 

1.0 

0.0 

0.4 

100.5 

0.0 

8.1 

5.2 

.-28 082.9 

0.4 

5.2 

6038.2 . 


a ^Hay suficiente evidencia de que, con todas las variables independientes en el modelo, /3, < 0? 
Pruebe en el nivel de significancia a = .05. 

b Proporcione un intervalo de confianza de 95% para el porcentaje medio de aumento en rendimiento 
si *j = 914, * 2 = 65 y * 3 = 6. 


11.13 Prediccion de un valor particular 
de Y mediante regresion multiple 

En la Section 11.7 consideramos predecir un valor real observado de F en la regresion lineal 
simple , haciendo la variable independiente individual* = **. La solucion estuvo basada fuer- 
temente en las propiedades de 


error = Y* - F*, 

donde se observo que Y* = \ 3 0 + f3\X* era un pronosticador del valor real de Y y tambien un 
estimador para E(Y). El mismo metodo se utilizara en esta section para obtener la solucion 
correspondiente en el caso de una regresion lineal multiple. Suponga que hemos ajustado un 
modelo de regresion lineal multiple 

Y = /So + fi\x\ + P 2 X 2 + ■ ■ ■ + PkXk + e 

y que estamos interesados en predecir el valor de Y* cuando *, = **, * 2 =**,..., x k = x* k . 
Predecimos el valor de Y* con 

Y* = 0o + Pixl + 0 2 x *2 + • • ' + Pk4 = a')8, 

donde r , 


* 


* 

k_ 


a = 
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A1 igual que en la Seccion 11.7 nos concentramos en la diferencia entre la variable Y* y el 
valor predicho: 


error = Y* - Y*. 

Como Y* y Y* estan distribuidas normalmente, el error esta distribuido normalmente; si apli- 
camos el Teorema 5.12 y los resultados de la Seccion 11.11, encontramos que 

E (error) =0 y V (error) = o- 2 [l + a'(X'X) _1 a] 


y que 


Z = 


Y* _ y* 


oV 1 +a , (X'X)- 1 a’ 


tiene una distribucion normal estandar. Ademas, si S es sustituido por cr, se puede demostrar 
que 

Y* _ y* 

T - , = 

Sy /1 +a'(X'X)-‘a 

tiene una distribucion t de Student con [n - (k +1)] grados de libertad. 

Si procedemos como en la Seccion 11.7, obtenemos el siguiente intervalo de prediccion 
100(1 - a)% para Y. 


Un intervalo de prediccion 100(1 -a)% para Y cuando*i - x*, 

X 2 = > • • ■ » *k = X k 

a'/3 ± t a/2 Sy/ 1 + a'(X'X)-'a, 
donde a' = [1, x*, x \,..., x £]. 


EJEMPLO 11.17 Suponga que el experimento que genero los datos del Ejemplo 11.12 se va a ejecutar de nuevo 
con x = 2. Prediga el valor particular de Y con 1 - a = .90. 


Solucion En el Ejemplo 11.12 determinamos que 

1/5 0 

0 1/10 


£ = 


(X'X) 1 = 


Debido a que estamos interesados en x = 2, el intervalo de prediccion deseado esta dado por 


a'/3 ± t a/2 Sy/l +a'(X'X)->a 


con 



a'(X'Xr‘a 


a'/3 = 

[1 2 ] 


= [1 2 ] 


= 2.4, 


'1/5 

0 

T 

0 

1/10 _ 

2 


= . 6 . 
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A1 igual que antes, s = .606 para estos datos y el valor de 1 05 con n — 2 = 3 grados de libertad 
es 2.353. El intervalo de prediccion de 90% para una observacion futura en Y cuando x = 2 
es, por tanto, 

2.4 ± (2.353)(.606)Vl + .6, o 2.4 ± 1.804. 

Observe la concordancia del resultado con la respuesta proporcionada en el Ejemplo 11.7 en 
donde empleamos algebra ordinaria en lugar del metodo matricial en la solucion. ■ 


Ejercicios 

11.77 Consulte el Ejercicio 11.76. Obtenga un intervalo de prediccion de 95% para el porcentaje de aumento 
en rendimiento en un campo con saturacion de base = 914 libras/acre, saturacion de fosfato = 65% y 
pH del suelo = 6. 

11.78 Consulte el Ejercicio 11.69. Encuentre un intervalo de prediccion de 98% para las ventas del Lexus en 
2004. Use el modelo cuadratico. 

11.79 Consulte los Ejercicios 11.74 y 11.75. Encuentre un intervalo de prediccion de 90% para Y si 7j = 50, 
P = 20, C = 1 y T 2 = 200. 


11.14 Una prueba para H 0 : /3 g+ i = Pg +2 = • • • = ft = 0 

A1 buscar un estadfstico de prueba razonablemente atractivo para probar una hipotesis relacio- 
nada con un conjunto de parametros del modelo lineal, llegamos a la consideracion de la suma 
de cuadrados de las desviaciones SSE. Suponga, por ejemplo, que debemos ajustar un modelo 
que comprende solo un subconjunto de las variables independientes en consideracion, esto es, 
ajustar un modelo reducido de la forma 

modelo R: Y = /3 0 + fi\Xy + ^ 2 X 2 + ■ ■ • + f3 g x g + e 

a los datos y que luego debemos calcular la suma de cuadrados de las desviaciones entre los 
valores observados y pronosticados de Y, SSE /; . Habiendo hecho esto, podrfamos ajustar el 
modelo lineal con todas las variables independientes propuestas presentes (el modelo com¬ 
plete): 

modelo C: Y = /3o + f5\X\ + /3 2 X2 + • • • + /3 g x g + f3 g+ ix g+l + • • • + fax ,t + e 

y determinar la suma de cuadrados de las desviaciones para este modelo, SSE C . Observe que 
el modelo completo contiene todos los terminos del modelo reducido, modelo R, mas los 
terminos extra x g+1 , x g+2 ,.. ., x k (observe que k > g). Si x +1 , x g+2 , . ... x k contribuye con una 
cantidad importante de informacion para la prediccion de Y que no este contenida en las varia¬ 
bles Xj, x 2 ,, x g (esto es, al menos uno de los parametros /3 ?+1 , /3 ?+2 ,. . ., /3 k difiere de cero), 
(Cual serfa la relacion entre SSE /( , y SSE C ? Intuitivamente vemos que si x g+l , x g+2 , . . . , x k son 
variables que aportan informacion importante, el modelo C, el modelo complete debe predecir 
con un error de prediccion menor que el modelo R. Esto es, SSE C debe ser menor que SSE /( ,. 
Cuanto mayor sea la diferencia (SSE /; - SSE C ), mas fuerte sera la evidencia para apoyar la 
hipotesis alternativa de que x g+l , x g+2 , . . . , x k contribuye con informacion para la prediccion 
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de Y y para rechazar la hipotesis nula 


Ho: /3 g+ 1 - P g +2 - ■ • • - fa - 0. 

La disminucion en la suma de cuadrados de las desviaciones (SSE /(1 - SSE C ) recibe el nom- 
bre de suma de cuadrados asociada con las variables x g+l , x g+2 , . . . , x k , ajustada para las 
variables x v x 2 , x 3 ,. . ., x g . 

Indicamos que valores grandes de (SSE R - SSE C ) nos llevarian a rechazar la hipotesis 

Ho ■ /3g+i = (3 g +2 =■■■= fa = 0. 

(i Que tan grande es “grande”? Crearemos un estadfstico de prueba que es una funcion de 
(SSE r - SSE C ) para el cual conocemos la distribucion cuando H 0 es verdadera. 

Para obtener este estadfstico de prueba, supongamos que la hipotesis nula es verdadera y 
luego examinemos las cantidades que hemos calculado. En particular, observe que 

SSE* = SSE C + (SSE s - SSE C ). 


En otras palabras, como indicamos en la Figura 11.8, hemos dividido SSE /; en dos partes: 
SSE C y la diferencia (SSE /( - SSE C ). Aunque omitimos la prueba, si H 0 es verdadera, enton- 
ces 


L 3 


2 _ 


SSEr 


SSE C 

a 2 


Xi 


SSEr — SSE C 


tiene distribuciones de probabilidad y 2 en muestreo repetitivo, con (n-[g + 1]), (n - [k + 1]), 
y (k - g) grados de libertad, respectivamente. Ademas, se puede demostrar que Xi y X\ son 
estadfsticamente independientes. 

La definicion de una variable aleatoria con una distribucion F se da en la Definicion 7.3. 
Considere la razon 


Xi /(k-g) 
Xl/(n ~[k + 1]) 


(SSEr — SSE c )/(^ — g) 
(SSE c )/(« - [k + 1]) 
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Si H 0 : /3 f+1 = (3 g+2 = ■ ■ ■ = fi k = 0 es verdadera, entonces F tiene una distribution F con 
Vj = k - g grados de libertad en el numerador y v 2 = n — (k + 1) grados de libertad en el 
denominador. Ya hemos dicho que valores grandes de (SSE s - SSE C ) nos llevan a rechazar la 
hipotesis nula. Entonces, valores grandes de F favorecen el rechazo de H 0 ; si deseamos una 
prueba con una probabilidad de error tipo I igual a a, se deduce que 

F> F a 

es la region de rechazo apropiada. (Vease la Tabla 7, Apendice 3.) 


EJEMPLO 11.18 /.Los datos del Ejemplo 11.13 proporcionan suficiente evidencia para indicar que el modelo de 
segundo orden 


Y = j3 0 + jSj.r + PtX 2 + e 


aporta information para la prediction de Y! Esto es, pruebe la hipotesis H 0 : /3 l = = 0 

contra la hipotesis alternativa H a : al menos uno de los parametros (i 2 difiere de 0. Use a = 
.05. Obtenga limites para el nivel de significancia alcanzado. 


Solucion Para el modelo completo, determinamos en el Ejemplo 11.15 que SSE C = .463. Como desea¬ 
mos probar H 0 : [3 l = [3 2 = 0, el modelo reducido apropiado es 


para el cual 


Y=/3 0 + e 


Xq 


-0- 


1- 

0 


1 

1 

y X = 

1 

1 


1 

.3. 


.1. 


Porque X'X 
Entonces, 


5, (X'X)- 1 = 1/5 y j8 = (X'X)- X'Y = (1/5) Vi = 3 =5/5=1 


SSE r = Y'Y - )8'X'Y 


Y7 X Y; V/ ; V; 


i=i 

2 


= 11 -(l/5)(5r = 11 - 5 =6. 


En este ejemplo, el numero de variables independientes del modelo completo es k = 2, y el 
numero de variables independientes del modelo reducido es g = 0. Por tanto, 

F = (SSE r -SSE c )/(k-g) = (6 — ,463)/(2 — 0) = (| 

(SSEc)/(n ~[k + 1]) .463/(5 - 3) 


El valor F tabulado para a = .05 con v l = k - g = 2 grados de libertad en el numerador y 
v 2 = n — (k + 1) = 2 grados de libertad en el denominador es 19.00. Por tanto, el valor ob- 
servado del estadistico de prueba no cae en la region de rechazo y concluirfamos que en el 
nivel de a = .05 no hay suficiente evidencia para apoyar la afirmacion de que /3, o /3 9 difiera 
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de cero. Debido a que la forma apropiada de la region de rechazo es F > F a , el valor p esta 
dado por P (F > 11.959) cuando F esta basada en 2 grados de libertad en el numerador y 2 
en el denominador. Usando la Tabla 7, Apendice 3, usted puede ver que .05 < valor p < .10. 
Ademas, la aplicacion F-Ratio Probabilities and Quantiles da l } (F > 11.959) = .07717. En 
consecuencia, si escogemos a = .05 (de acuerdo con la exposition previa), no hay suficiente 
evidencia para apoyar la afirmacion de que [3 l o (3-, difiera de cero. No obstante, si se seleccio- 
na cualquier valor a igual o mayor que .0772 podrfamos decir que ya sea (3 t A 0 o que [3 2 A 0. 
Observese que el pequeno esfuerzo adicional requerido para determinar el valor p aporta una 
considerable cantidad de informacion adicional. ■ 


Considere la situation donde hemos ajustado un modelo con k variables independientes y 
deseamos probar la hipotesis nula 

H 0 :p l = p 2 = ■■■=&= 0 

de que ninguna de las variables independientes del modelo contribuye con informacion im- 
portante para la prediccion de Y. Esto es exactamente lo que se hizo en el Ejemplo 11.18. Un 
examen de la solution de ese ejemplo convencera al lector de que el modelo reducido apro- 
piado es de la forma 

Y=/3 0 + s. 

Este modelo reducido contiene g = 0 variables independientes y es tal que SSE /( = S yy (vea el 
Ejemplo 11.18). Por tanto, una prueba para 

H 0 :,Si = As-/3* = 0 

puede estar basada en el estadfstico 

= (SSE r — SSE c )/(fc — g) = {Syy ~ SSE c )/k 
(SSE c )/(n ~[k + 1]) (SSEc)/(« - [k + 1])’ 

que tiene una distribucion F con v, =kyv 2 = n-(k+ 1) grados de libertad en el numerador 
y el denominador, respectivamente. 

/.Que proporcion de la variation en los valores observados de la variable de respuesta, Y, 
es explicada por todo el conjunto de variables independientes jq, x 2 ,, x{! La respuesta esta 
dada por el coeficiente multiple de determinacion R 2 , donde 

r>2 _ Syy ~ SSEp 
K — -. 

Syy 

Al igual que con el coeficiente sencillo de determinacion r 2 , el denominador de R 1 cuantifica 
la variation en los valores y, y el numerador cuantifica la cantidad de variation en las y que 
esta explicada por el conjunto completo de variables independientes jq, x 2 , , x k . En el 

Ejercicio 11.84(a), usted demostrara que el estadfstico F para probar 

Ha : jSj = ft = • • ■ = p k = 0 

se puede calcular usando R 2 mediante la formula 

n-(k + 1) / R 2 \ 
k \1- R 2 )' 
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A1 igual que antes, este estadfstico tiene una distribucion F con v t = k y v 2 = n — (k + 1) 
grados de libertad en el numerador y en el denominador, respectivamente. 

Otra aplicacion del metodo general para comparar modelos completos y reducidos se da 
en el siguiente ejemplo. 


EJEMPLO 11.19 Se desea relacionar la resistencia a la abrasion del caucho ( Y) con la cantidad de relleno de 
sflice x \ y la cantidad de agente de acoplamiento x 'i. Se agregan fibras de sflice de partfculas 
finas al caucho para aumentar su fuerza y resistencia a la abrasion. El agente de acoplamiento 
enlaza qui'micamente el relleno a las cadenas de polimeros del caucho y en esa forma aumenta 
la eficiencia del relleno. La unidad de medida para x[ y x ' 2 es partes por 100 partes de caucho, 
lo cual se denota como phr. Para mayor simplicidad en los calculos, las cantidades reales de 
relleno de sflice y agente de acoplamiento se cambian de escala mediante las ecuaciones 

x\ — 50 xk 4 

Xl = ^^ y X2 = — ' 

(Este cambio de escala de las variables independientes no afecta el analisis ni las conclusio- 
nes, pero simplifica los calculos.) 

Los datos 11 se proporcionan en la Tabla 11.6. Observe que se emplean cinco niveles de x } 
y de x 2 , con el punto (x : = 0, x 2 = 0) repetido tres veces. Ajustemos el modelo de segundo 
orden 


Y — /So + /3ixi + (3 2 X 2 + ftxj - + @ 4 X 2 + f3$x\X2 + £ 

a estos datos. Este modelo representa una superficie conica sobre el piano (x,, x 2 ). Ajuste el 
modelo de segundo orden y pruebe H 0 : f } 3 = /3 4 = /3 S = 0. (Estamos probando que la super¬ 
ficie es en realidad un piano contra la alternativa de que es una superficie conica.) Indique los 
lfinites para el nivel de significancia alcanzado e indique la conclusion apropiada si escoge- 
mos a = .05. 

Solucion Primero usaremos ecuaciones matriciales para ajustar el modelo completo, como ya indi- 
camos antes. (Con modelos de este tamano, es mejor usar una computadora para hacer los 
calculos.) Para los datos de la Tabla 11.6 tenemos 


Tabla 11.6 Datos para el Ejemplo 11.19 


y 

Xi 

Xl 

83 

1 

-1 

113 

1 

1 

92 

-1 

1 

82 

-1 

-1 

100 

0 

0 

96 

0 

0 

98 

0 

0 

95 

0 

1.5 

80 

0 

- 1.5 

100 

1.5 

0 

92 

- 1.5 

0 


11. Fuente : Ronald Suich y G. C. Derringer, Technometrics 19(2) (1977): 214. 








11.14 Una prueba para H 0 : j3g +l = /3 g+2 = ■ ■ ■= ft = 0 629 





Xl 


x 2 

xf 

xf 

xix 2 


‘ 83 - 



- 1 1 


-1 

1 


1 

-1 - 


113 



1 1 


1 

1 


1 

1 


92 



1 -1 


1 

1 


1 

-1 


82 



1 -1 


-1 

1 


1 

1 


100 



1 0 


0 

0 


0 

0 

Y = 

96 

, x 

= 

1 0 


0 

0 


0 

0 


98 



1 0 


0 

0 


0 

0 


95 



1 0 


1.5 

0 


2.25 

0 


80 



1 0 


-1.5 

0 


2.25 

0 


100 



1 1.5 


0 

2.25 

0 

0 


. 92 . 



- 1 -1.5 


0 

2.25 

0 

0 - 


- .33 

0 

0 

— 

.15 


-.15 

0 ■ 



0 

0.12 0 

0 

0 

0 



0 

0 

0.12 

0 

0 

0 


(X'X) 

-1 _ 

-.15 

0 

0 


.15 


.05 

0 



-.15 

0 

0 


.05 


.15 

0 



0 

0 

0 

0 

0 

.25 


Estas matrices dan como re 

xiltado 














'98.00' 









4.00 







— 1 


7.35 





P = 

(X'X) X'Y = 



88 

’ 








-4.66 









5.00 





o el modelo ajustado de segundo orden. 


y = 98.00 + 4.00x + 7 . 35 x 2 — . 88 xj — 4.66x| + 5 . 00 xiX 2 . 

En el caso de este modelo, SSE C = Y'Y — /3'X'Y = 77.948. 

Para probar la hipotesis de interes (H 0 : /3 3 = /3 4 = (3 5 = 0), debemos ajustar el modelo 
reducido 


Y — /3q + (3\Xi + ($ 2 X 2 + e. 


Si borramos las columnas para xf, xf, y X\X 2 en la matriz X, tenemos 


/3 = (X'X) ‘x'Y 


y el modelo piano ajustado es 


-93.73- 
4.00 , 
. 7.35. 


y = 93.73 + 4.00xi + 7 . 35 x 2 . 

(Observe que no podemos simplemente igualar 183 , /3 4 , y /3s a cero para producir el modelo 
ajustado en el caso reducido.) Para el modelo reducido, SSE ;; = 326.623. 
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Ahora probamos la hipotesis H 0 : /3 3 = /3 4 = (3 5 = 0 al calcular F (Observe que k = 5, 
g = 2yn= 11 ): 

= (SSEs — SSE c )/(fc ~ g) = (326.623 - 77.948)/3 = 

SSE C /[n — (k + 1)] 77.948/5 

Como este estadfstico se basa en v, = (k - g) = 3 grados de libertad en el numerador y v 2 
= n - (k + 1) = 5 grados de libertad en el denominador, el valor p esta dado por P(F > 
5.32). Entonces, usando la Tabla 7, Apendice 3, .05 < valor p < .10. La aplicacion F-Ratio 
Probabilities and Quantiles proporciona el valor p exacto = P (F > 5.32) = .05155. Si es- 
cogemos a = .05, no hay suficiente evidencia para apoyar la afirmacion de que el modelo de 
segundo orden ajusta los datos considerablemente mejor que el modelo piano. <,EI valor p 
exacto = .05155 es lo suficientemente pequeno para convencerlo de que el modelo de segun¬ 
do orden ajusta mejor que el modelo piano? Solo usted puede contestar esa pregunta. Observe 
que hemos probado si el grupo de variables x,, x 2 , x |X 2 contribuyo a un considerablemente 
mejor ajuste del modelo a los datos. ■ 


Ejercicios 

11.80 Consulte el Ejercicio 11.31. Conteste la pregunta sobre el aumento en la corriente pico al construir una 
prueba F. 

11.81 En el Ejercicio 11.80 usted ernpleo una prueba F para comprobar la misma hipotesis que se probo en 
el Ejercicio 11.31 por medio de una prueba t. Considere el caso general de regresion lineal simple y los 
estadlsticos F y t que se puedan usar para poner en practica la prueba de H 0 : /Sj = 0 contra H a : f3 l F 0. 
Demuestre que en general F = t 2 . Compare el valor de F obtenido en el Ejercicio 11.80 con el corres- 
pondiente valor de t obtenido en el Ejercicio 11.31. 

11.82 Consulte el Ejercicio 11.76 donde obtuvimos la siguiente information al ajustar un modelo de regresion 
simple a 15 respuestas; 

y = 38.83 -0.0092x1 - 0.92x2 + 11.56x3, = 10 965.46, SSE = 1107.01. 


a i,Hay suficiente evidencia para concluir que al menos una de las variables independientes contribuye 
con information importante para el pronostico de F? 
b Calcule el valor del coeficiente de determination multiple. Interprete el valor de R 2 . 

11.83 Consulte los Ejercicios 11.76y 11.82. ^La inclusion de las variables de saturation de fosfato x 2 y pH x 3 
contribuye a un ajuste significativamente mejor del modelo a los datos? El modelo de regresion lineal 
reducido Y = fi 0 + j8,Xi + e se ajusto y observamos SSEj; = 5470.07. 

a Lleve a cabo la prueba apropiada de hipotesis en el nivel de significancia a = .05. 
b ^Cual es el mmimo valor de SSE R que le hubiera permitido concluir que al menos una de las variables 
(saturation de fosfato y/o pH) contribuyo a un mejor ajuste del modelo a los datos? 

11.84 Hemos ajustado un modelo con k variables independientes y deseamos probar la hipotesis nula H 0 : 

Pi ~ Pi ~ ■■■ — Pk = 0 . 
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a Demuestre que el estadfstico de prueba apropiado con distribution F se puede expresar como 

n-{k + 1) / R 2 \ 
k 

b Si k = 1, icomo se compara el valor de F del inciso a con la expresion para el estadfstico T deducido 
en el Ejercicio 11.55? 

11.85 Los datos computarizados de un agente de bienes rafces contienen la lista de precios de venta Y (en miles 
de dolares), el area de vivienda x t (en cientos de pies cuadrados), el numero de pisos x 2 , el numero de 
alcobas x 3 y el numero de banos x 4 para condominios recien registrados. El modelo de regresion multi¬ 
ple E(Y) = /3q + fl\X\ + /3 2 x 2 + P 3 X 3 + / 64 X 4 se ajusto a los datos obtenidos al seleccionar de manera 
aleatoria 15 departamentos actualmente en el mercado. 

a Si R 2 = .942, (,hay suficiente evidencia de que al menos una de las variables independientes contri- 
buya con informacion importante para el pronostico del precio de venta? 
b Si S yy = 16 382.2, ^cual es SSE? 

11 .86 Consulte el Ejercicio 11.85. Un corredor de bienes rafces sospecha que la superficie en pies cuadrados, 
x v podrfa ser la variable de pronostico mas importante y que las otras variables se pueden eliminar del 
modelo sin mucha perdida de informacion en la prediction. El modelo de regresion lineal simple para 
precio de venta contra superficie en pies cuadrados se ajusto a los 15 datos que se emplearon en el 
Ejercicio 11.85 y el corredor de bienes rafces observo que SSE = 1553. Las variables independientes 
adicionales usadas para ajustar el modelo en el Ejercicio 11.85 ^pueden cancelarse del modelo sin per- 
der informacion de prediction? Pruebe en el nivel de significancia a = .05. 

11.87 ^E1 valor grande de R 2 siempre implica que al menos una de las variables independientes deba ser rete- 
nida en el modelo de regresion? ^,Un valor pequeno de R 2 siempre indica que ninguna de las variables 
independientes son utiles para la prediction de la respuesta? 

a Suponga que un modelo con k = 4 variables independientes se ajusta usando n = 7 datos y que 
R 2 = .9. ^.Cuantos grados de libertad en el numerador y en el denominador estan asociados con el 
estadfstico F para probar // 0 : /3[ = /3 2 = / 8 3 = /S 4 = 0? Use el resultado del Ejercicio 11.84(a) para 
calcular el valor del estadfstico F apropiado. ^Puede H 0 ser rechazada en el nivel de significancia de 
a = . 10 ? 

b Consulte el inciso a. (,Que observa usted acerca de los tamanos relativos de n y kl (,Que impacto tiene 
esto en el valor de F? 

c Un modelo con k = 3 variables independientes se ajusta a n = 44 datos que resultan en R 2 = .15. 
^Cuantos grados de libertad en el numerador y en el denominador estan asociados con el estadfstico 
F para probar F/ 0 : /S x = /S 2 = /S 3 = 0? Use el resultado del Ejercicio 11.84(a) para calcular el valor 
del estadfstico F apropiado. ^Puede H 0 ser rechazada en el nivel de significancia de a = .10? 
d Consulte el inciso c. (,Que observa acerca de los tamanos relativos de n y kl (,Que impacto tiene esto 
en el valor de F? 

11 .88 La publicidad en television, en el caso ideal, estarfa destinada exactamente a la audiencia que ve los 
anuncios. Se realizo un estudio para determinar el tiempo que las personas pasan viendo TV durante las 
horas de mayor audiencia al oscurecer. Se observaron veinte personas durante un periodo de una semana 
y de cada una se registro el tiempo promedio que pasaban viendo TV al oscurecer, llamado Y. Tambien 
se registraron otros cuatro datos para cada individuo: x 3 = edad, x 2 = grado de escolaridad, x 3 = ingreso 
disponible yr 4 = cociente de inteligencia. Considere los tres modelos dados a continuation: 

Modelo I: Y — fi 0 + f3iX\ + P 2 X 2 + P 3 X 3 + 164 X 4 + £ 

ModeloII: Y = ft + /3|Xi + /3 2 x 2 + £ 

ModeloIII: Y = /3o + fi\X\ + j 6 2 x 2 + (3 3 X\x 2 + e 
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^Las siguientes frases son verdaderas o falsas? 

a Si se ajusta el modelo I, la estimacion para a 2 esta basada en 16 grados de libertad. 
b Si se ajusta el modelo II, podemos realizar la prueba t para determinar si x 2 contribuye a un mejor 
ajuste del modelo a los datos. 

c Si los modelos I y II se ajustan, entonces SSEj £ SSEjj. 
d Si los modelos I y II se ajustan, entonces o-p £ crjj . 
e El modelo II es una reduction del modelo I. 

f Los modelos I y III se pueden comparar usando la tecnica de modelo completo/reducido presentado 
en la Section 11.14. 


11.89 


Consulte los tres modelos dados en el Ejercicio 11.88. Denote con /?j, y los coeficientes de 

determination para los modelos I, II y III. ^.Las expresiones siguientes son verdaderas o falsas? 


a R 2 
b R 


1 = 

4 


"IP 

4l 

4r 


11.90 Consulte el Ejercicio 11.69. 

a Para el modelo cuadratico realice una prueba F de H 0 : @ 2 = 0, usando a = .05. Compare el resultado 
con la solution de la prueba en el Ejercicio 11.72. 
b Pruebe H 0 : (3 1 = @ 2 = 0 con un nivel de significance de 5%. 

11.91 Consulte el Ejercicio 11.74. Pruebe la hipotesis con un nivel de significance de 5% de que ni 7j ni T 2 
afectan la production. 

11.92 Las empresas de energti electrica, que deben planear la operation y expansion de generation de elec- 
tricidad, estan muy interesadas en pronosticar la demanda de clientes tanto a corto como a largo plazos. 
Se realizo un estudio a corto plazo para investigar el efecto de la temperature x t media diaria de cada 
mes y el costo por kilowatt-hora, x 2 en el consumo medio diario (en kWh) por familia. Los directores de 
la companti esperaban que la demanda de electricidad subiera en climas frfos (debido a la calefaccion 
empleada), bajara cuando la temperature fuera moderada y volviera a subir la demanda cuando la tem¬ 
perature aumentara y fuera necesario usar el aire acondicionado. Esperaban que la demanda se redujera 
a medida que subiera el costo por kilowatt-hora, reflejando mayor atencion a la conservation. Se obtu- 
vieron datos durante 2 anos, periodo durante el cual el costo por kilowatt-hora x 2 aumento debido a los 
crecientes costos del combustible. Los directores de la compafua ajustaron el modelo 


Y = fa + piXi + P 2 xl + Pt,X 2 + @ 4 X 1 X 2 + @5X 2 X 2 + e 


a los datos de la siguiente tabla y obtuvieron y = 325.606— 11.383X[ + .113xj—21.699.^2 + .873jtiX 2 
- ,009 xjX 2 con SSE = 152.1776. 



Precio por kWh (x 2 ) 


Consumo medio diario 
(kWh) por familia 



80 

Temperature media diaria en °F (xO 

31 

34 

39 

42 

47 

56 


Consumo medio diario ( y) 

55 

49 

46 

47 

40 

43 

100 

Temperature media diaria en °F (X]j 

32 

36 

39 

42 

48 

56 


Consumo medio diario ( y ) 

50 

44 

42 

42 

38 

40 

80 

Temperature media diaria en °F {x\) 

62 

66 

68 

71 

75 

78 


Consumo medio diario ( y) 

41 

46 

44 

51 

62 

73 

100 

Temperature media diaria en °F (xi) 

62 

66 

68 

72 

75 

79 


Consumo medio diario ( y ) 

39 

44 

40 

44 

50 

55 
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Cuando el modelo Y = p 0 ~PiX\ + p 2 x[ + e se ajusto, la ecuacion de prediction fue y = 130.009 
— 3.302*! + .033*^ con SSE = 465.134. Pruebe si los terminos que contienen x 2 (x 2 , XiX 2 , xfx 2 ) con- 
tribuyen a un ajuste considerablemente mejor a los datos. Obtenga lfmites para el nivel de significance 
alcanzado. 

11.93 Consulte el Ejemplo 11.19. Usando el modelo reducido construyaun intervalo de confianza de 95% para 
la resistencia esperada del caucho a la abrasion cuando x t = 1 y x 2 = — 1. 

11.94 Consulte el Ejemplo 11.19. Construya pruebas individuales de las tres hipotesis H 0 : / 3 3 = 0, H 0 : /3 4 = 0 
y H 0 : /3 S = 0. Use un nivel de significance de 1% en cada prueba. (Si han de realizarse pruebas multiples 
en el mismo conjunto de datos, es conveniente usar un nivel a muy pequeno en cada prueba.) 


11.15 Resumen y conclusiones 

En este capftulo hemos empleado el metodo de mfnimos cuadrados para ajustar un modelo 
lineal a una respuesta experimental. Supusimos que el valor esperado de V es una funcion de 
un conjunto de variables x u x 2 , ■.., x k , donde la funcion es lineal en un conjunto de parametros 
desconocidos. Usamos la expresion 

Y = [}0 + PiXl + @2X2 + ' ' ' + PkXk + s 


para denotar un modelo estadfstico lineal. 

Los problemas inferenciales asociados con el modelo estadfstico lineal incluyen estima¬ 
tion y pruebas de hipotesis que se relacionan con los parametros de modelo /S 0 , /3],. . ., /3 k y, 
lo que es mas importante, el calculo de E ( Y) que es la respuesta esperada para un ajuste parti¬ 
cular y la prediction de algun valor futuro de Y. Experimentos para los cuales es apropiada la 
teorfa de mfnimos cuadrados incluyen experimentos controlados y aquellos en los que x h x 2 , 
. . ., x k son valores observados de variables aleatorias. 

(■,Por que usar el metodo de mfnimos cuadrados para ajustar un modelo lineal a un conjunto 
de datos? Donde las suposiciones acerca de los errores aleatorios s se cumplen [normalidad, 
independence, V (e) = cr 2 para todos los valores de x { , x 2 , . . . , x k }. se puede demostrar que 
el procedimiento de mfnimos cuadrados da los mejores estimadores insesgados lineales para 

f3 0 , [3^,, [i k . Esto es, si calculamos los parametros /3 0 , [3 t . fi k usando funciones lineales 

de y 1; y 2 , . . . , y k , los estimadores de mfnimos cuadrados tienen varianza minima. Algunos 
otros estimadores no lineales para los parametros pueden tener una menor varianza que los 
estimadores de mfnimos cuadrados, pero, si existen estos estimadores, no se conocen en este 
momento. De nueva cuenta, ^por que usar estimadores de mfnimos cuadrados? Son faciles de 
emplear y sabemos que tienen buenas propiedades para numerosas situaciones. 

Como puede imaginarse, la metodologfa presentada en este capftulo tiene uso generalizado 
en finanzas y en todas las ciencias para explorar la relation entre una respuesta y un conjunto 
de variables independientes. La estimation de E(Y) o la prediction de Y suele ser el objetivo 
experimental. 

Libros de texto enteros estan dedicados al tema de regresiones. Nuestro proposito ha sido 
introducir muchas de las consideraciones teoricas asociadas con regresion lineal simple y 
multiple. Aunque el metodo de mfnimos cuadrados se puede usar para calcular parametros 
de modelo en situaciones generates, las tecnicas formates de hacer inferencia que hemos pre- 
sentado (con base en distribuciones t y F) son validas solo dadas las suposiciones adicionales 
que presentamos. Las suposiciones clave incluyen que los terminos de error del modelo estan 
distribuidos normalmente y que la varianza de los terminos de error no depende del valor de 
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ninguna(s) variable(s) independiente(s). En aplicaciones practicas estas suposiciones pueden 
no ser validas. Generalmente las evaluaciones de la validez de suposiciones de un modelo estan 
basadas en analisis de los residuos, es decir, las diferencias entre valores observados y pronos- 
ticados (usando el modelo) de la variable de respuesta. El examen de los residuos, incluyen- 
do graficas de los residuos contra la(s) variable(s) independiente(s) y graficas de los residuos 
contra sus valores esperados teoricos normales, permite evaluar si las suposiciones son razonables 
para un conjunto de datos en particular. Los datos con residuos anormalmente grandes pueden 
ser los resultados atipicos que indican que algo anduvo mal cuando se hizo la observacion co- 
rrespondiente. Algunos datos individuales pueden tener un impacto anormalmente grande en el 
modelo de regresion ajustado, en el sentido de que el modelo ajustado con estos datos incluidos 
difiere de manera considerable del modelo ajustado con ellos excluidos (estos datos suelen recibir 
el nombre de puntos de alta influencia; vea Ejercicio 11.108). Un modelo de regresion podria 
sufrir d efalta de cijuste, lo cual indica que el modelo seleccionado no es adecuado para modelar 
la respuesta. En tales casos podria ser necesario ajustar un modelo mas complicado para obtener 
precision suficiente de prediccion. Una consideration importante en los modelos de regresion 
multiple es la de multicolinealidad en la que algunas de las variables independientes del modelo 
estan correlacionadas de modo estrecho entre ellas. No podemos hacer justicia a estos temas en 
un solo capftulo introductorio sobre regresion lineal y multiple. Nos hemos concentrado en el 
concepto general de mmimos cuadrados como un metodo para estimar parametros de modelo y 
hemos dado las bases teoricas para el analisis basado en la teorfa normal clasica. Los otros temas 
descritos en esta section se tratan en las referencias adicionales. 
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Ejercicios complementarios 

11.95 A temperaturas que se aproximan al cero absoluto ( — 273°C), el helio exhibe caracterfsticas que desaffan 
a numerosas leyes de la fisica convencional. Se realizo un experimento con helio en forma solida a di- 
ferentes temperaturas cercanas al cero absoluto. El helio solido se coloca en un refrigerador de dilution 
junto con una sustancia impura solida y se registro la fraction (en peso) de la impureza que paso por el 
helio solido. (El fenomeno de solidos que pasan directamente por solidos se conoce como efecto cudn- 
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tico de tunel.) Los datos se proporcionan en la siguiente tabla. 


Temperatura (jc) en °C 

Proportion de impureza que 
pasa por el helio (y) 

-262.0 

.315 

-265.0 

.202 

-256.0 

.204 

-267.0 

.620 

-270.0 

.715 

-272.0 

.935 

-212 A 

.957 

-272.7 

.906 

-272.8 

.985 

-272.9 

.987 


a Ajuste una recta de mfnimos cuadrados a los datos. 

b Pruebe la hipotesis nula H 0 : /3 1 = 0 contra la hipotesis altemativa H a : [3 l < 0, con un nivel de signi- 
ficancia de a = .01. 

c Encuentre un intervalo de prediccion de 95% para el porcentaje de la impureza solida que pasa por el 
helio solido a —273°C. (Este valor de x esta fuera de la region experimental donde el uso del modelo 
para prediccion puede ser peligroso.) 

11.96 Se realizo un estudio para determinar si existe una relation lineal entre la resistencia a la ruptura y de 
vigas de madera y la gravedad especffica x de la madera. Diez vigas seleccionadas al azar, de iguales di- 
mensiones de section transversal, se sometieron a esfuerzo hasta romperlas. Las resistencias a la ruptura 
y la densidad de la madera se muestran en la siguiente tabla para cada una de las diez vigas. 


Viga Gravedad especffica ( x ) Resistencia (y) 


1 

.499 

11.14 

2 

.558 

12.74 

3 

.604 

13.13 

4 

.441 

11.51 

5 

.550 

12.38 

6 

.528 

12.60 

7 

.418 

11.13 

8 

.480 

11.70 

9 

.406 

11.02 

10 

.467 

11.41 


a Ajuste el modelo Y = fi 0 + (i^x+ s. 

b Pruebe H 0 : [3 1 = 0 contra la hipotesis altemativa, H a : A 0. 

c Calcule la resistencia media para vigas con gravedad especffica .590 usando un intervalo de confianza 
de 90%. 

11.97 Una respuesta Y es una funcion de tres variables independientes x 1 , x 2 y x 3 que estan relacionadas como 
sigue: 


y — Pa + /3i*i + P2X2 + 183*3 + s. 
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a Ajuste el modelo a los n = 7 datos de la siguiente tabla. 


y 

Xi 

x 2 

x 3 

1 

-3 

5 

-1 

0 

-2 

0 

1 

0 

-1 

-3 

1 

1 

0 

-4 

0 

2 

1 

-3 

-1 

3 

2 

0 

-1 

3 

3 

5 

1 


b Prediga Y cuando x, = 1, x 2 = — 3, x 3 = — 1. Compare con la respuesta observada en los datos origi- 
nales. ,/Por que no son iguales los dos valores? 

c ^Los datos presentan suficiente evidencia para indicar que x 3 contribuye con information para la 
prediction de Y? (Pruebe la hipotesis H 0 : f) 3 = 0, usando a — .05.) 
d Encuentre un intervalo de confianza de 95% para el valor esperado de Y, dadas x 1 = l,x 2 — — 3 y x 3 
= - 1 . 

e Encuentre un intervalo de prediction de 95 % para Y, dadas x i = l,x 2 — —3yx 3 = — 1. 

11.98 Si valores de las variables independientes estan igualmente espaciados, ^cual es la ventaja de codificar 
nuevas variables que representen espaciamiento simetrico alrededor del origen? 

11 .99 Supongamos que usted desea ajustar una recta a un conjunto de n puntos, donde n es un entero par y que 
puede seleccionar los n valores de x del intervalo —9 £ x ^ 9. ^Como deberra seleccionar los valores 
de x para minimizar V (/3 1 )? 

11.100 Consulte el Ejercicio 11.99. Es cornun emplear igual separation al seleccionar los valores de x. Suponga 
que n — 10. Encuentre la eficiencia relativa del estimador j3 1 basado en igual separation contra el mismo 
estimador basado en la separation del Ejercicio 11.99. Suponga que —9 < x £ 9. 

11.101 Los datos de la siguiente tabla provienen de la comparacion de los porcentajes de crecimiento para bac- 
terias tipos A y B. El crecimiento Y registrado en cinco puntos igualmente espaciados (y codificados) de 
tiempo se muestra en la tabla. 





Tiempo 



Tipo de bacteria 

-2 

-1 

0 

1 

2 

A 

8.0 

9.0 

9.1 

10.2 

10.4 

B 

10.0 

10.3 

12.2 

12.6 

13.9 


a Ajuste el modelo lineal 

Y = Po + jSiXi + j8 2 X2 + /3 3 x 1 x 2 + e 

a los n = 10 puntos. Sea x 3 = 1 si el punto se refiere a bacterias tipo B y sea Xj = 0 si el punto se 
refiere al tipo A. Sea x 2 = tiempo codificado. 

b Grafique los puntos y las dos rectas de crecimiento. Observe que fi 3 es la diferencia entre las pendien- 
tes de las dos rectas y representa la interaction tiempo-bacteria. 
c Prediga el crecimiento del tipo A en el tiempo x 2 = 0 y compare la respuesta con la grafica. Repita el 
proceso para el tipo B. 

d ^Los datos presentan suficiente evidencia para indicar una diferencia en los porcentajes de crecimien¬ 
to para los dos tipos de bacteria? 









Ejercicios complementarios 637 


11.102 


11.103 


11.104 


*11.105 


e Encuentre un intervalo de confianza de 90% para el crecimiento esperado para el tipo B en el tiempo 

x 2 = 1. 

f Encuentre un intervalo de prediction de 90% para el crecimiento Y del tipo B en el tiempo x 2 = 1. 

El siguiente modelo fue propuesto para probar si habfa evidencia de discrimination salarial contra mu- 
jeres en el sistema de una universidad estatal: 

Y = [3o + P\X\ + p 2 x 2 “E P3X\X 2 ~E Pa x 2 “E £, 

donde 

Y = salario anual (en miles de dolares), 

! 1, si es mujer, 

0, si es hombre, 

x 2 = cantidad de experiencia (en anos). 

Cuando este modelo se ajusto a datos obtenidos de los registros de 200 miembros de la facultad, SSE = 
783.90. El modelo reducido Y = /3o + Ptx 2 + p 2 x 2 + £ tambien se ajusto y produjo un valor de 
SSE = 795.23. (,Los datos dan suficiente evidencia para apoyar el dicho de que el salario medio depende 
del genero de los miembros de la facultad? Use a = .05. 

Demuestre que la ecuacion de prediction de rmnimos cuadrados 

y = $0 + P1X1 H-+ PkXk 


pasa por el punto (x t , x 2 ,..Xk, y). 

Se realizo un experimento para determinar el efecto de presion y temperature en el rendimiento de una 
sustancia qufmica. Se emplearon dos niveles de presion (en libras por pulgada cuadrada, psi) y tres de 
temperature: 


Presion (psi) 

Temperatura (°F) 

50 

100 

80 

200 


300 


Una prueba del experimento en cada combination de temperatura-presion dio como resultado los datos 
que aparecen en la siguiente tabla. 


Rendimiento 

Presion (psi) 

Temperatura (°F) 

21 

50 

100 

23 

50 

200 

26 

50 

300 

22 

80 

100 

23 

80 

200 

28 

80 

300 


a Ajuste el modelo Y — p 0 +P\X\ + p 2 x 2 + p 3 x^ + s, donde x 1 = presion y x 2 = temperature, 
b Compruebe si p 3 difiere considerablemente de cero. con a = .05. 
c Pruebe la hipotesis de que la temperatura no afecta el rendimiento, con a = .05. 

Considere que (X, Y) tienen una distribution normal bivariante. Una prueba de H 0 : p = 0 contra H a : p ¥= 0 
se puede deducir como sigue. 
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a Sean S yy = ^T" = - y) 2 y S xx = Y,"=i (*/ “ *) 2 - Demuestre que 

& = r 

b Con la condition X,. = x i para i = 1, 2, . . . , n, demuestre que dada H 0 : p = 0 

j8iV(w — 2)S XX 
VSyyd -f 2 ) 

tiene una distribution f con (n - 2) grados de libertad. 
c Con la condition X, = para i = 1.2.n, concluimos que 

r\/« — 2 

r = -7= 

tiene una distribution t con (n - 2) grados de libertad, dada H 0 : p = 0. En consecuencia, concluimos 
que T tiene la misma distribution incondicionalmente. 

11.106 Los costos de mano de obra y materiales son dos componentes basicos en el costo de construction. Los 
cambios en los costos componentes por supuesto que llevan a cambios en los costos totales de construc¬ 
tion. La siguiente tabla da seguimiento a cambios en el costo de construction y en el costo de todos los 
materiales de construction durante 8 meses consecutivos. 



Mes 

Costo de 
construction (v) 

Indice de todos los 
materiales de 
construction (x) 

Enero 

193.2 

180.0 

Febrero 

193.1 

181.7 

Marzo 

193.6 

184.1 

Abril 

195.1 

185.3 

Mayo 

195.6 

185.7 

Junio 

198.1 

185.9 

Julio 

200.9 

187.7 

Agosto 

202.7 

189.6 


^,Los datos aportan suficiente evidencia para indicar una correlation diferente de cero entre los costos 
mensuales de construction y los indices de todos los materiales de construction? Calcule el nivel de 
significancia alcanzado. 

11.107 Los datos de la siguiente tabla proporcionan las millas por galon recorridas por un automovil de prueba 
cuando utiliza gasolinas de niveles variables de octanaje. 


Millas por galon (y) 

Octano ( x ) 

13.0 

89 

13.2 

93 

13.0 

87 

13.6 

90 

13.3 

89 

13.8 

95 

14.1 

100 

14.0 

98 
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a Calcule el valor de r. 

b ^Los datos dan suficiente evidencia para indicar que el nivel de octanaje y las millas por galon son 
dependientes? Obtenga el nivel de significancia alcanzado, e indique su conclusion si desea realizar 
una prueba en el nivel de a = .05. 

11.108 Ejercicio Applet Entre a la aplicacion Removing Points from Regression. A veces, remover un punto 
de los que se usan para ajustar un modelo de regresion produce un modelo ajustado que es muy distinto 
del obtenido cuando se usan todos los datos (por ejemplo un punto recibe el nombre de punto de alta 
influencia). 

a La grafica superior proporciona un conjunto de datos y una recta de regresion ajustada utiles para pre- 
decir el peso de un estudiante segun su estatura. Haga clic en cualesquiera puntos para eliminarlos y 
reajustar el modelo de regresion. ^Puede hallar un punto de alta influencia? 
b Arrastre a la segunda grafica que relaciona una calificacion cuantitativa SAT (Scholastic Aptitud Test) 
con la clasificacion secundaria. ^La pendiente de la recta de regresion ajustada le sotprende? ^Puede 
hallar un punto de alta influencia? ^Eliminar ese punto produce una recta de regresion que satisface 
mejor su expectativa con respecto a la relacion entre calificaciones cuantitativas SAT y clasificacion en 
el grupo? 

c Arrastre al resto de los conjuntos de datos y explore que ocurre cuando se remueven diferentes puntos. 
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Consideraciones al disenar 
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12.1 Los elementos que afectan la informacion en una muestra 

12.2 Diseno de experimentos para aumentar la precision 

12.3 El experimento de observaciones pareadas 

12.4 Algunos disenos experimentales elementales 

12.5 Resumen 

Bibliograffa y lecturas adicionales 


12.1 Los elementos que afectan la informacion 
en una muestra 

Una medida significativa de la informacion que contiene una muestra para hacer una infe- 
rencia acerca de un parametro poblacional es proporcionada por el ancho (o semiancho) del 
intervalo de confianza que pudiera construirse a partir de los datos muestrales. Recuerde que 
un intervalo de confianza de muestra grande de 95% para una media poblacional es 

7 ± 1 ' 96 fe> 

Los anchos de muchos de los intervalos de confianza que se emplean comunmente, como el 
intervalo de confianza para una media poblacional, dependen de la varianza poblacional cr 
y el tamano muestral n. Cuanto menor sea la variacion en la poblacion, medida por cr 2 , mas 
corto sera el intervalo de confianza. Del mismo modo, el ancho del intervalo de confianza dis- 
minuye cuando n aumenta. Este interesante fenomeno nos llevana a pensar que dos factores 
afectan la cantidad de informacion en una muestra relacionada con un parametro: es decir, 
la variacion de los datos y el tamano muestral n. Encontraremos esta deduccion demasiado 
simple pero es esencialmente verdadera. 

En capftulos anteriores, cuando estuvimos interesados en comparar dos medias poblacio- 
nales o ajustar una regresion lineal simple, supusimos que muestras aleatorias independientes 
se tomaron de las poblaciones de interes. Si deseamos comparar dos poblaciones con base 
en un total de n observaciones, ^cuantas observaciones deben tomarse de cada poblacion? 
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Si hemos decidido ajustar un modelo de regresion lineal simple y deseamos maximizar la 
information de los datos resultantes, ^como debemos escoger los valores de la variable inde- 
pendiente? Estas preguntas se responden en la siguiente section. 

Generalmente el diseno de experimentos es un tema muy amplio que se refiere a meto- 
dos de muestreo para reducir la variation en un experimento y, por tanto, para adquirir una 
cantidad especificada de information al mmimo costo. Si la meta es hacer una comparacion 
de dos medias poblacionales, con frecuencia es suficiente el experimento de observaciones 
pareadas. Despues de considerar el experimento de observaciones pareadas de la Section 
12.3, el resto del capftulo presenta algunas consideraciones importantes acerca del diseno de 
buenos experimentos. 


12.2 Diseno de experimentos para 
aumentar la precision 

Como veremos, para el mismo numero total de observaciones, algunos metodos de recolec- 
cion de datos (disenos) proporcionan mas information respecto a parametros poblacionales 
espetificos que otros. Ningun diseno individual es mejor para adquirir informacion respecto a 
todos los tipos de parametros poblacionales. De hecho, el problema de hallar el mejor diseno 
para concentrar informacion en un parametro poblacional espetifico se ha resuelto en solo 
unos cuantos casos. El proposito de esta section no es presentar una teorfa general sino, mas 
bien, presentar dos ejemplos que ilustran los principios involucrados. 

Considere el problema de calcular la diferencia entre un par de medias poblacionales, 
/r,j - jU 2 , con base en muestras aleatorias independientes. Si el experimentador tiene recursos 
suficientes para muestrear un total de n observaciones, /cuantas observaciones debe seleccio- 
nar de las poblaciones 1 y 2, es decir, n t y n 2 (n, + n 2 = n), respectivamente, para maximizar 
la informacion de los datos pertinentes a pt x — /x 2 ? Si n = 10, ^debe seleccionar n i = n 2 = 5 
observaciones de cada poblacion, o serfa mejor una asignacion de n, = 4 y n 2 = 6? 

Si las muestras aleatorias se sacan independientemente, calculamos p, i - /x 2 con Y\ — IS, 
que tiene error estandar 


(T (Y l -Y 2 ) 



Cuanto menor sea cr ( y l Yl y menor sera el correspondiente error de calculo y mayor sera la 
cantidad de informacion de la muestra pertinente a /x, - p 2 . Si, como es frecuente suponer, 
of = of = a 2 , entonces 


a ( Yi-Y 2 ) 



1 

ni' 


Usted puede verificar que esta cantidad es minima cuando n, = n n y, en consecuencia, que la 
muestra contiene un maximo de informacion acerca de /x, - /i 2 cuando las n unidades expe- 
rimentales se dividen por igual entre los dos tratamientos. Un caso mas general se considera 
en el Ejemplo 12.1. 
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EJEMPLO 12.1 


Solucion 


FI G U RA 12.1 
Ajuste de una recta 
por el metodo de 
mmimos cuadrados 


Si han de usarse n observaciones para calcular /jl 1 - /jl 2 , con base en muestras aleatorias in- 
dependientes de las dos poblaciones de interes, encuentre n { y n 2 para que V(Y\ — Y o) sea 
minimizada (suponga que n l + n 2 = ri). 


Denote con b la fraccion de las n observaciones asignadas a la muestra de la poblacion 1; esto 
es, «[ = bn y n 2 = (1 - b)n. Entonces, 


V(Y i - Y 2 ) 


+ 


bn (1 — b)n 


Para hallar la fraccion b que minimiza esta varianza, igualamos a cero la primera derivada 
con respecto a b. Este proceso da 


n \b 2 ) n \ 1 — b 


2 


= 0 . 


Si despejamos b tendremos 




b = 

CT\ + 02 

Por tanto, V(Y\ — Y 2 ) esta minimizada cuando 


1-6 = 


02 


n 1 


V (J\ + 02 / 


«2 


cr, + 02 


( ——— 

V o"i + 02 / 


es decir, cuando tamanos muestrales se asignan de manera proporcional a tamanos de las des- 
viaciones estandar. Observe que n x = nl 2 = n 2 si cr x =cr 2 . ■ 


Como segundo ejemplo considere el problema de ajustar una recta que pasa por un con- 
junto de n puntos usando el metodo de mmimos cuadrados del Capftulo 11 (vea Figura 12.1). 
Ademas, suponga que estamos interesados principalmente en la pendiente /3 de la recta del 
modelo lineal 


Y = /3 0 + /3,x + e. 


y 



X 
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Si tenemos la opcion de seleccionar los n valores de x para los cuales y se observara, ^cua- 
les valores de x maximizan la cantidad de informacion acerca de (3 , ? Tenemos una variable 
independiente cuantitativa x, y nuestro problema es decidir sobre los valores x v x 2 ,..., x n a 
emplear, asi como el numero de observaciones a tomar en cada uno de estos valores. 

El mejor diseno para estimar la pendiente f3 l se puede determinar si consideramos la des- 
viacion estandar de f3\: 




Vs^ 


-xf 


Cuanto mayor sea S xx , la suma de los cuadrados de las desviaciones de x t , x 2 , ..., x n alrededor 
de su media, menor sera la desviacion estandar de (3\ . Esto es, obtenemos un mejor estimador 
para la pendiente si los valores de x estan mas dispersos. En algunos casos el experimentador 
tiene alguna region experimental, por ejemplo x t < x < x 2 , sobre la cual desea observar Y, 
y esta amplitud se selecciona con frecuencia antes del experimento. Entonces el valor mas 
pequeno para cr^ se presenta cuando los n puntos estan igualmente divididos, con la mitad 
ubicada en la frontera inferior x, de la region y la mitad en la frontera superior x 2 . (Se omite 
la prueba.) Un experimentador que desee ajustar una recta, con el uso d e«= 10 puntos en el 
intervalo 2 < x < 6. seleccionana cinco puntos en x = 2 y cinco en x = 6. Antes de concluir 
el analisis de este ejemplo, debe advertir que observar todos los valores de Y en solo dos va¬ 
lores de x no dara informacion sobre la curvatura de la curva de respuesta en caso de que la 
suposicion de linealidad en la relation de E(Y) y x sea incorrecta. A menudo es mas seguro 
seleccionar unos cuantos puntos (uno o dos) en algun lugar cercano a la parte media de la 
region experimental, para detectar la curvatura, si existe (vease la Figura 12.2). Un comen- 
tario adicional es oportuno. Una de las suposiciones que hemos hecho respecto al modelo de 
regresion lineal simple es que la varianza del termino de error e no depende del valor de la 
variable independiente x. Si los valores x estan mas dispersos, la validez de esta suposicion 
puede ser mas cuestionable. 

Para resumir, hemos dado buenos disenos (asignacion de unidades experimentales por po- 
blacion y seleccion de ajustes para la variable independiente x) para comparar un par de 
medias y ajustar una recta. Estos dos disenos simples ilustran el modo en que la informacion 
de un experimento puede aumentarse o disminuirse, dependiendo de donde se hagan las ob- 


FIGURA 12.2 y 
Un buen diseno para 
ajustar una recta 
(n = 10) 


4 puntos 




2 puntos 


4 puntos 


x 
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servaciones y de la asignacion de tamanos muestrales. En la siguiente section consideramos 
un metodo para controlar la cantidad de variabilidad inherente a un experimento. 


Ejercicios 

12.1 Supongamos que usted desea comparar las medias para dos poblaciones y que of = 9, cr| = 25 y n = 
90. ^Que asignacion de n = 90 para las dos muestras resultara en la maxima cantidad de information 
acerca de (/Xj - /x 2 )? 

12.2 Consulte el Ejercicio 12.1. Supongamos que usted asigna n 1 = n 2 observaciones a cada muestra. ^Que 
tan grandes deben ser n l y n 2 para obtener la misma cantidad de information que la implicada por la 
solution del Ejercicio 12.1? 

12.3 Suponga, como en el Ejercicio 12.1, que dos poblaciones tienen varianzas respectivas cq 2 = 9 y 
cr 2 =25. Encuentre el rninimo tamano muestral y la correspondiente asignacion muestral que dara un 
intervalo de confianza de 95% para /jl 1 - /x 2 que mida 2 unidades de longitud. 

12.4 Consulte el Ejercicio 12.3. ^Cuantas observaciones son necesarias para que un intervalo de confianza de 
95% sea de 2 unidades de longitud si n x = n 2 ? 

12.5 Suponga que deseamos estudiar el efecto del estimulante denominado digitalina en la presion sanguinea 
Y de ratas con dosis dex = 2ax: = 5 unidades. Se espera que la respuesta sea lineal en la region; esto 
es, Y = Pq + /3p: + e. Se dispone de seis ratas para el experimento y cada rata puede recibir solo una 
dosis. ^Que dosis de digitalina debe emplearse en el experimento y cuantas ratas deben inocularse en 
cada dosis para maximizar la cantidad de information del experimento con respecto a la pendiente /3[ ? 

12.6 Consulte el Ejercicio 12.5. Considere dos metodos para seleccionar las dosis. El metodo 1 asigna tres 
ratas a la dosis x = 2 y tres ratas a jc = 5. El metodo 2 igualmente separa las dosis entre x = 2 y x = 5 
{x = 2, 2.6, 3.2, 3.8, 4.4 y 5.0). Suponga que cr se conoce y que la relation entre E(Y)y x es verdade- 
ramente lineal (vea el Capftulo 11). Si usamos los datos de ambos metodos para construir intervalos de 
confianza para la pendiente j3j, ^,cual metodo dara como resultado el intervalo mas largo? ^.Cuanto mas 
largo es el intervalo? Si usamos el metodo 2, ^aproximadamente cuantas observaciones seran necesarias 
para obtener un intervalo de la misma longitud que el obtenido por la asignacion optima del metodo 1 ? 

12.7 Consulte el Ejercicio 12.5. ^Por que podrfa ser aconsejable asignar uno o dos puntos en x = 3.5? 

12.8 El error estandar del estimador en un modelo de regresion lineal simple se hace mas pequeno cuando 
S xx aumenta, es decir, cuando los valores x se hacen mas dispersos. (j P° r que no siempre dispersamos los 
valores x tanto como es posible? 


12.3 El experimento de observaciones pareadas 

En los Capftulos 8 y 10 consideramos metodos para comparar las medias de dos poblaciones 
con base en muestras independientes de cada una. En la section anterior examinamos la forma 
de determinar los tamanos de las muestras de las dos poblaciones para que el error estandar 
del estimador Y\ — 1% sea minimizado. En muchos experimentos las muestras son pareadas 
mas que independientes. Una situation que ocurre comunmente es aquella donde se hacen 
observaciones repetidas en la misma unidad de muestreo, por ejemplo obtener el peso de una 
misma persona antes y despues de que participe en un programa de reduction de peso. En un 
experimento medico podrfamos parear individuos que sean del mismo genero y tengan pesos 
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y edades similares. Un individuo de cada par se selecciona al azar para que reciba uno de dos 
medicamentos competidores para controlar la hipertension, mientras que el otro individuo del 
mismo par recibe el otro medicamento. 

La comparacion de dos poblaciones con base en datos pareados puede ser un diseno ex¬ 
perimental muy eficaz que puede controlar fuentes extranas de variabilidad y resultar en la 
disminucion del error estandar del estimador Y\ — Y 2 para la diferencia en las medias pobla- 
cionales /j, - /j, 2 . Con (Y u , Y 2i ), para i = 1,2,... n, denote una muestra aleatoria de observa¬ 
ciones pareadas. Suponga que 

E(Y U ) = Ml> Var( Y u ) = of, E(Y 2i ) = p 2 , 

Var(K 2i ) = of, Cov(Fi,-, Y 2i ) = pa x a 2 . 


donde p es el coeficiente de correlation comiin de las variables dentro de cada par (vea la 
Section 5.7). Defina con I) ! = Y u - Y 2j , para i = 1.2,... n, las diferencias entre las observa¬ 
ciones dentro de cada par. Debido a que los pares de observaciones se supusieron indepen- 
dientes y distribuidos identicamente, los valores /.) , para i = 1,2,... n, son independientes y 
distribuidos identicamente; usando el Teorema 5.12, vemos que 

Pd = E(Dj) = E(Y U ) - E(Y 2l ) = /x, - pi 2 , 

al = Var(A) = Var( Y u ) + Vai -(Y 2i ) -2Cov(Y u , Y 2i ) 

= erf + al — 2pa\a 2 . 


A partir de estas consideraciones, un estimador natural para / j , - p 2 es el promedio de las 
diferencias D = Y\—Y 2 ,y 


E(D) = fi D = p. i - p, 2 , 

4 = Var(D) = — = — \a{ + al — 2pa\o 2 1. 
u nn 

Si la information se habia obtenido de un experimento con muestras independientes y n x 
= n 2 = n, 


E(Y x -Y 2 ) = pi -p 2 , 


(J 


2 F,-F, = ^K + -2 2 ]. 


Si es razonable creer que en los pares ( Y u , Y 2j ), para i = 1,2,... n, los valores de Y u y 
Y 2i tenderan a aumentar o disminuir juntos (p > 0), entonces un analisis de las expresiones 
anteriores para a=^ del experimento de pares acoplados y a ^ y ( del experimento de mues¬ 
tras independientes demuestra que el experimento de observaciones pareadas proporciona un 
estimador con menor varianza que el experimento de muestras independientes. En el Ejercicio 
12.11 pediremos al lector que decida cuando es que los dos experimentos generaran estima- 
dores con la misma varianza y cuando el experimento de muestras independientes dara como 
resultado el estimador con la menor varianza. 

Debido a que parear muestras hace dependientes las observaciones dentro de cada par, no 
podemos usar los metodos que previamente se desarrollaron para comparar poblaciones con 
base en muestras independientes entre si. El analisis de un experimento de observaciones 
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pareadas utiliza las n diferencias pareadas, D h para i = 1,2,... n. Las inferencias respecto a 
las diferencias en las medias /j, - /jl 2 se construyen haciendo inferencias respecto a la media 
de las diferencias, /jl d . Defina 


1 " 

d = -J2 d < 

n * J 


1=1 


y s 2 d 



i=l 


y utilice el procedimiento apropiado de una muestra para completar la inferencia. Si el nume- 
ro de pares, y por tanto el numero de diferencias, es grande, por ejemplo n > 30, se pueden 
emplear los metodos inferenciales de muestra grande desarrollados en los Capftulos 8 y 10. Si 
el numero de diferencias n es pequeno y es razonable suponer que las diferencias estdn distri- 
buidas normalmente en forma aproximada, podemos usar metodos inferenciales con base en 
la distribucion t. llustramos esto con el siguiente ejemplo. 


EJEMPLO 12.2 Deseamos comparar dos metodos para determinar el porcentaje de mineral de hierro en mues- 
tras de mineral. Debido a que es probable que diferencias inherentes a las muestras de mineral 
contribuyan con variabilidad no deseada en las mediciones que observamos, fue creado un 
experimento de observaciones pareadas al dividir en dos partes cada una de las 12 muestras 
de mineral. La mitad de cada muestra se selecciono al azar y se sometio al metodo 1; la otra 
mitad se sometio al metodo 2. Los resultados se presentan en la Tabla 12.1. <^Los datos aportan 
suficiente evidencia de que el metodo 2 arroja un porcentaje promedio mas alto que el metodo 
1? Pruebe usando a = .05. 

Solucion Hemos formado las diferencias de la Tabla 12.1 tomando la medida del metodo 1 y restando 
la correspondiente medicion del metodo 2. Si el porcentaje medio para el metodo 2 es mayor, 
entonces /jl d = /jl 1 - p. 2 < 0. Entonces, probamos 

H 0 : p. D = 0 contra H a : p D < 0. 


Tabla 12.1 Datos para el experimento de observaciones pareadas 
del Ejemplo 12.2. 


Muestra de mineral 

Metodo 1 

Metodo 2 

dj 

1 

38.25 

38.27 

-.02 

2 

31.68 

31.71 

-.03 

3 

26.24 

26.22 

+.02 

4 

41.29 

41.33 

-.04 

5 

44.81 

44.80 

+.01 

6 

46.37 

46.39 

-.02 

7 

35.42 

35.46 

-.04 

8 

38.41 

38.39 

+.02 

9 

42.68 

42.72 

-.04 

10 

46.71 

46.76 

-.05 

11 

29.20 

29.18 

+.02 

12 

30.76 

30.79 

-.03 



d = -.0167 
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Para estos datos, 


5 


2 

D 



.0112 - — (-. 20) 2 
12 

11 


.0007. 


Si es razonable suponer que las diferencias estan distribuidas normalmente, se deduce que 


d- 0 _ -.0167 

So AA V-0007 f\/\2 


-2.1865 


es el valor observado de un estadfstico que dada la hipotesis nula tiene una distribucion t con n 
-1 = 11 grados de libertad (gl). Usando la Tabla 5, Apendice 3, con a = .05, rechazamos H 0 si 
t < -1.796. Por tanto, deducimos que existe suficiente evidencia para permitirnos concluir que 
el metodo 2 arroja un porcentaje promedio mas alto que el metodo 1. De nuevo, usando la Tabla 
5, Apendice 3, se deduce que .025 < valor p < .05. La aplicacion Student’s t Probabilities and 
Quantiles da el valor p exacto = P(t < -2.1865) = P{t> 2.1856) = .02564. ■ 


Aunque los resultados del Ejemplo 12.2 implican que los resultados del experimento son 
estadfsticamente significativos, podemos evaluar la significancia practica del resultado al for- 
mar un intervalo de confianza para p, D . Si es razonable suponer que las diferencias dentro 
de cada par estan distribuidas normalmente en forma aproximada, un intervalo de confianza de 
100(1 - a)% para pu D = p, l - p, 2 esta dado por 


D±t r 


■ft- 


Sd_ 

S/n 


donde t aP esta basada en n - 1 grados de libertad (recuerde que n es el numero de pares de 
observaciones). 


EJEMPLO 12.3 


Use los datos del Ejemplo 12.2 para formar un intervalo de confianza de 95% para la diferen- 
cia en lecturas medias de porcentaje usando los metodos 1 y 2. 


Solucion Del Ejemplo 12.2 observamos que 

d = —.0167, 4 = .0007, n-l = ll. 

Debido a que, con 11 grados de libertad, 1 025 = 2.201, el intervalo deseado es 


-.0167 ±(2.201) 


VD007 

Vl2 


o (-.0335, +.0001). ■ 


Los metodos anteriores basados en la distribucion t se pueden emplear de manera valida si 
es razonable suponer que las diferencias estan distribuidas normalmente. Cuando compara- 
mos dos medias poblacionales basadas en pequenas muestras independientes, requerimos que 
las varianzas poblacionales sean iguales. La validez del analisis de observaciones pareadas 
no requiere la suposicion de varianzas poblacionales iguales. La cantidad 4 proporciona un 
estimador insesgado para la varianza de las diferencias, cr|,, cualesquiera que sean los valores 
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de of, cr, 2 y p. La prueba t de muestras independientes tambien requeria que ambas muestras 
fueran tomadas de poblaciones distribuidas normalmente. Una forma en que las diferencias 
dentro de pares puedan adoptar una distribucion normal es que Y u , para i = 1, 2,..., n, y Y 2i , 
para i = 1,2,...,/;, tengan una distribucion normal. No obstante, es posible que las diferen¬ 
cias por pares se encuentren distribuidas normalmente incluso si las fj y las Y 2 no lo estan. El 
Ejercicio 12.17 presenta un ejemplo de esta situacion. Entonces, la suposicion de que las di¬ 
ferencias esten distribuidas normalmente es menos restrictiva que la suposicion de que ambas 
poblaciones esten distribuidas normalmente. 

Hemos visto que el experimento de observaciones pareadas se puede usar para disminuir 
la variabilidad inherente presente en los datos. Ademas, en muchas situaciones, las suposi- 
ciones requeridas para emplear de manera valida un analisis de observaciones pareadas son 
menos restrictivas que los correspondientes metodos de muestras independientes. ^Por que los 
analistas de estadistica encuentran datos de observaciones pareadas? A veces el experimen¬ 
to de observaciones pareadas se realizo por diseno, tomando en cuenta las consideraciones 
previamente discutidas. Otras veces se obtuvieron datos por medio del experimento de obser¬ 
vaciones pareadas por comodidad. Cualquiera que sea la razon para realizar un experimento 
de observaciones pareadas, los datos resultantes no deben ser analizados usando un metodo 
apropiado para datos obtenidos usando muestras independientes. 

Recuerde que los datos de un experimento de observaciones pareadas se analizan con- 
centrandose en las diferencias de las observaciones dentro de cada par. Asi, algunos expertos 
en estadistica prefieren referirse al experimento de observaciones pareadas como a un ex¬ 
perimento de diferencia pareada. En la siguiente seccion presentamos alguna terminologia 
comun asociada con disenos experimentales y consideramos extensiones del experimento de 
las muestras independientes y el experimento de observaciones pareadas. 


Ejercicios 

12.9 Considere los datos analizados en los Ejemplos 12.2 y 12.3. 

a Suponiendo que los dos metodos empleados para analizar las muestras trabajaron razonablemente 
bien, ^por que piensa usted que las observaciones en las dos mitades de cada muestra de mineral 
estaran correlacionadas positivamente? 

b ^Piensa usted que deberiamos haber tornado observaciones independientes usando los dos metodos, 
o deberiamos haber realizado el analisis pareado contenido en el texto? ^Por que? 

12.10 Es frecuente que se comparen dos computadoras al ejecutar un conjunto de varios programas “de com¬ 
paracion” y registrar la diferencia en tiempo de la unidad de procesamiento central (CPU) necesario para 
completar el mismo programa. Seis programas de comparacion, ejecutados en dos computadoras, pro- 
dujeron la siguiente tabla de tiempos del CPU (en minutos). 





Programa de comparacion 


Computadora 

1 

2 

3 

4 

5 

6 

1 

1.12 

1.73 

1.04 

1.86 

1.47 

2.10 

2 

1.15 

1.72 

1.10 

1.87 

1.46 

2.15 


a (,Los datos aportan suficiente evidencia para indicar una diferencia en los tiempos medios del CPU 
necesarios para que las dos computadoras terminen un trabajo? Pruebe usando a = .05. 
b Obtenga los llmites para el valor p asociado. 

c Encuentre un intervalo de confianza de 95% para la diferencia en tiempo medio del CPU necesario 
para que las dos computadoras terminen un trabajo. 
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12.11 Cuando Y lj , para i = 1, 2,... ,n, y Y 2i , para i = 1,2,..., n, representan muestras independientes de 
dos poblaciones con medias /jl 1 y /jl 2 y varianzas erf y of, respectivamente, hemos determinado que 
ojy — ) = ( 1 /«)(crf + of). Si las muestras fueron pareadas y calculamos las diferencias, D ; , para i = 
1, i, ... ,n, determinamos que <x(2/D) = (l/n)(cr 2 + of - 2pcr 1 a2). 

a i Cuando es a 2 - . mayor que <x (2/D)? 

b f Cuando es <r ( y _y j igual que cr (2/D)? 

c f Cuando es eff . menor que o- (2/D)? 

d Con base en la exposition del texto y sus respuestas a los incisos a-c, i cuando serfa mejor realizar el 
experimento de observaciones pareadas y cuando serfa mejor llevar a cabo el experimento de mues¬ 
tras independientes? 

12.12 Consulte el Ejercicio 12.11. Supongaque of = of = a 2 . Los valores de la tabla empleados paraponer 
en practica una prueba de hipotesis o construir un intervalo de confianza dependen, para muestras pe- 
quenas, del numero de grados de libertad asociados con las estimaciones para a 2 o of. 

a Suponiendo dos muestras independientes, cada una de tamano n, y que of = of = a 2 , feuantos 
grados de libertad estan asociados con el estimador para la varianza comun o' 2 ? 

b Suponiendo un experimento de pares acoplados formado de n pares de observaciones, f cuantos gra¬ 
dos de libertad estan asociados con el estimador de of? 

c Suponga que todas las suposiciones necesarias para realizar los procedimientos t de muestras inde¬ 
pendientes estan satisfechas y que deseamos hallar un intervalo de confianza de 95% para la diferen- 
cia en medias. fCuales son los valores de t 0 -, 5 usados para construir intervalos de confianza para la 
diferencia en medias con base en las muestras independientes y los experimentos de observaciones 
pareadas si n = 5? fSi n = 10? fSi n = 30? 

d Si estan satisfechas todas las suposiciones necesarias para realizar los procedimientos t de muestras 
independientes, identifique una posible desventaja para practical' un experimento de observaciones 
pareadas en lugar de tomar muestras independientes. 

12.13 El Ejercicio 10.76 describe un experimento dental realizado para investigar la efectividad de un enjua- 
gue oral para inhibir el crecimiento de placa en los dientes. Los sujetos se dividieron en dos grupos: un 
grupo utilizo un enjuague que contenfa el agente antiplaca y el grupo de control utilizo un enjuague solo 
con ingredientes inactivos. Otro experimento ha sido efectuado para evaluar el crecimiento de placa para 
personas que han empleado el enjuague con el agente antiplaca. Para cada persona del estudio, se midio 
el aumento de placa 4 horas despues de usar el enjuague y otra vez 8 horas despues. Si desea comparer 
el aumento medio de placa para los dos momentos diferentes, f implementarfa un analisis con base en un 
procedimiento de observaciones pareadas o de muestras independientes? fPor que? 

12.14 Dos procedimientos para sinterizar (calentar) cobre se han de comparer al probar cada uno de ellos en 
seis tipos diferentes de polvo. La medicion de interes es la porosidad (porcentaje de volumen debido a 
huecos) de cada especimen de prueba. Los resultados de las pruebas se muestran en la siguiente tabla. 


Polvo 

Procedimiento I 

Procedimiento II 

1 

21 

23 

2 

27 

26 

3 

18 

21 

4 

22 

24 

5 

26 

25 

6 

19 

16 


fHay suficiente evidencia para decir que el procedimiento II produce valores de porosidad mas altos? 
Proporcione llmites para el valor p. fQue se concluirfa en el nivel a = .05? 
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12.15 Un gerente de planta, para decidir si compra una maquina de diseno A o diseno B, comprueba los tiern- 
pos para completar cierto trabajo en cada maquina. Ocho tecnicos se emplearon en el experimento, con 
cada tecnico usando ambas maquinas en un orden aleatorio. Los tiempos (en segundos) necesarios para 
completar el trabajo se proporcionan en la siguiente tabla. 


Tecnico 

A 

B 

1 

32 

30 

2 

40 

39 

3 

42 

42 

4 

26 

23 

5 

35 

36 

6 

29 

27 

7 

45 

41 

8 

22 

21 


a Realice una prueba para ver si hay una diferencia importante entre los tiempos medios para comple¬ 
tar el trabajo, con un nivel de significancia de 5%. 

b ^Piensa usted que parear tecnicos hubiera sido mejor en este caso? Explique. 
c ^Que suposiciones son necesarias para la prueba del inciso a? 

12.16 El humus es el tipo de suelo rico y altamente organico que sirve como medio primario de crecimiento 
para la vegetation en los pantanos de la Florida. Debido a la alta concentration de material organico, el 
humus puede ser destruido con el tiempo por varias causas originadas por el hombre. Miembros de la 
Comision de Caza y Pesca de Florida marcaron varios lugares en los pantanos y midieron la profundidad 
del humus en cada lugar, operation que repitieron 6 anos despues. La siguiente tabla identifica una parte 
de los datos (dados en pulgadas) obtenidos. 


Lugar 

Lectura inicial 

Lectura posterior 

Lugar 

Lectura inicial 

Lectura posterior 

1 

34.5 

31.5 

9 

44.0 

35.2 

2 

44.0 

37.9 

10 

40.5 

37.2 

3 

37.5 

35.5 

11 

27.0 

24.7 

4 

27.0 

23.0 

12 

29.5 

25.8 

5 

37.0 

34.5 

13 

31.5 

29.0 

6 

40.0 

31.1 

14 

35.0 

36.8 

7 

47.2 

46.0 

15 

44.0 

36.5 

8 

35.2 

31.0 





a Realice una prueba para ver si hay suficiente evidencia para indicar una diminution en la profundi¬ 
dad promedio del humus durante el periodo de estudio. Proponga llmites del valor p asociado. ^Que 
concluirfa si deseara hacer una prueba en el nivel a = .01? (Aunque hay libertad de tomar las 
diferencias necesarias en el orden que se prefiera, la respuesta dada al final del libro supone que las 
diferencias se formaron al tomar lecturas finales menos lecturas iniciales.) 

b Indique un intervalo de confianza de 95% para la diferencia en profundidades medias del humus al 
final y al principio del estudio. Interprete este intervalo. [Vea la observation en seguida del inciso 
a.] 

c Indique un intervalo de confianza de 95% para la profundidad media inicial del humus en la parte de 
los pantanos en que se realizo el estudio. 

d Repita las instrucciones del inciso c para las lecturas finales. 

e iQue suposiciones son necesarias para aplicar las tecnicas empleadas para contestar los incisos a y 
b? iY los incisos c y d? 
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12.17 Consulte el experimento de observaciones pareadas y suponga que la /-esima medicion (i = 1, 2), en el 
y-esimo par, donde/ = 1, 2,..., n , es 

Y H = /*i + u j + e U’ 

donde /r ; = respuesta esperada para la poblacion i, donde i = 1,2, 

Uj = una variable aleatoria que esta distribuida uniformemente en el intervalo (-1, + 1), 

Ejj = error aleatorio asociado con la i-esima medicion del j-esimo par. 

Suponga que las Sy son variables aleatorias normales independientes con E(Sjj) = 0 y te(ey) = cr 
y que Uj y e l; - son independientes. 

a Encuentre £(iA). 

b Explique que las }j. para j = 1,2,... ,n, no estan distribuidas normalmente. (No hay necesidad de 
hallar realmente la distribution de los valores Y t .) 

c Demuestre que Cov(ij ; -, Y 2 j) — 1/3, para j =1,2,... ,n . 

d Demuestre que Dj = Yy - Y 2j son variables aleatorias distribuidas normalmente. 

e En los incisos a-d se verified que estas diferencias dentro de cada par pueden estar distribuidas nor¬ 
malmente aun cuando las mediciones individuates dentro de los pares no lo esten. ^Puede proponer 
otro ejemplo que ilustre este mismo fenomeno? 


12.4 Algunos disenos experimentales elementales 

En los Capltulos 8 y 10 consideramos metodos para comparar las medias de dos poblacio- 
nes con base en muestras aleatorias independientes obtenidas de cada una. La Seccion 12.3 
se referfa a una comparacion de dos medias poblacionales mediante el experimento de ob¬ 
servaciones pareadas. En esta seccion presentamos consideraciones generates asociadas con 
disenar experimentos. En especial consideramos extensiones de las metodologias de muestras 
independientes y de observaciones pareadas cuando el objetivo es comparar las medias de mas 
de dos poblaciones. 

Suponga que deseamos comparar cinco tecnicas de ensenanza. A, B, C, D y E, y que 
usamos 125 estudiantes en el estudio. La meta es comparar las califteaciones medias en un 
examen estandarizado para estudiantes instruidos con cada uno de los cinco metodos. / Como 
se procederfa? Aunque los 125 estudiantes de alguna manera sean representatives de los es¬ 
tudiantes a quienes estan dirigidos estos metodos de ensenanza, /todos los estudiantes son 
identicos? Obviamente la respuesta es negativa. 

Es probable que haya muchachos y muchachas en el grupo y que los metodos puedan no 
ser igualmente eficaces para ambos generos; tambien es probable que haya diferencias en las 
capacidades naturales de los estudiantes del grupo, lo cual resulta en que algunos estudiantes 
lo hagan mejor cualquiera que sea el metodo de ensenanza que se utilice. Diferentes estudian¬ 
tes pueden provenir de familias que ponen especial atencion en la educacion y esto podrfa 
tener impacto en las califteaciones en el examen estandarizado. Ademas, puede haber otras 
diferencias entre los 125 estudiantes que tendrian un efecto no anticipado en las califteaciones 
del examen. 

Con base en estas consideraciones decidimos que podrfa ser mejor asignar al azar 25 
estudiantes a cada uno de cinco grupos. Cada grupo recibira ensenanza usando una de las 
tecnicas motivo de estudio. La division aleatoria de los estudiantes en los cinco grupos logra 
dos objetivos. Primero, eliminamos el posible efecto de sesgo de las caracterfsticas indivi- 
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duales de los estudiantes en las mediciones que hacemos. En segundo termino proporciona 
una base probabilfstica para la selection de la muestra que permita al experto en estadfstica 
calcular probabilidades asociadas con las observaciones de la muestra y usarlas para hacer 
inferencias. 

El experimento anterior ilustra los componentes basicos del diseno de un experimento. Las 
unidades experimentales del estudio son los estudiantes. 


DEFINICION 12.1 Las unidades experimentales son los objetos sobre los que se toman mediciones. 

Este experimento comprende un solo factor, es decir, un metodo de ensenanza. En este 
experimento el factor tiene cinco niveles : A, B, C, D y E. 

DEFINICION 12.2 Los factores son variables controladas completamente por el experimentador. El nivel 

de intensidad (subcategorfa distinta) de un factor es su nivel. 

En un experimento de un solo factor como el anterior, cada nivel del factor individual re- 
presenta un tratamiento. Asf, en nuestro ejemplo de education, hay cinco tratamientos, uno 
correspondiente a cada uno de los metodos de ensenanza. Como otro ejemplo, considere un 
experimento realizado para investigar el efecto de varias cantidades de nitrogeno y fosfato en 
la production de una variedad de mafz. Una unidad experimental serfa una superficie especifi- 
cada, por ejemplo 1 acre, de mafz. Un tratamiento serfa un numero fijo de libras de nitrogeno 
x 1 y de fosfato x 2 aplicados a un acre determinado de mafz. Por ejemplo, un tratamiento podrfa 
ser usar x, = 100 libras de nitrogeno por acre y x 2 = 200 libras de fosfato. Un segundo tra¬ 
tamiento podrfa corresponder a.q = 150 y x 2 = 100. Observe que el experimentador podrfa 
usar diferentes cantidades (x,, x 2 ) de nitrogeno y fosfato y que cada combinacion representarfa 
un tratamiento diferente. 

DEFINICION 12.3 Un tratamiento es una combinacion especffica de niveles de factor. 


El experimento anterior para comparar los metodos de ensenanza A, B, C, D y E supuso 
dividir al azar los 125 estudiantes en cinco grupos, cada uno de tamano 25. Cada grupo re- 
cibio exactamente uno de los tratamientos. Este es un ejemplo de un diseno completamente 
aleatorizado. 


DEFINICION 12.4 Un diseno completamente aleatorizado para comparar k tratamientos es aquel en el 
que un grupo de n unidades experimentales relativamente homogeneas se dividen al 
azar en k subgrupos de tamanos n v n 2 ,..., n k (donde n l + n 2 + • • • + n k = n). Todas 
las unidades experimentales de cada subgrupo reciben el mismo tratamiento, con cada 
tratamiento aplicado a exactamente un subgrupo. 
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Asociada a cada tratamiento esta una poblacion (a veces conceptual) consistente en todas 
las observaciones que habrian resultado si el tratamiento se aplicara en forma repetida. En el 
ejemplo de la ensenanza podrfamos ver una poblacion de todas las posibles calificaciones de 
examen si todos los estudiantes recibieran la ensenanza usando el metodo A. Las poblaciones 
conceptuales correspondientes estan asociadas a cada uno de los otros metodos de ensenanza. 
Asi, cada tratamiento tiene una poblacion correspondiente de mediciones. Las observaciones 
obtenidas de un diseno completamente aleatorizado se ven de manera tipica como muestras 
aleatorias independientes tomadas de las poblaciones correspondientes a cada uno de los 
tratamientos. 

Suponga que deseamos comparar cinco marcas de aspirina, A, B, C, D y E, respecto a la 
cantidad media de ingrediente activo por tableta para cada una de las marcas. Decidimos se- 
leccionar 100 tabletas al azar de la production de cada uno de los fabricantes y usamos los re- 
sultados para realizar la comparacion. En este caso, fisicamente muestreamos cinco poblacio¬ 
nes diferentes. Aun cuando no “aplicamos” los diferentes tratamientos a un lote homogeneo 
de tabletas en bianco, es comun referirse a este experimento como a uno que comprende un 
solo factor (el fabricante) y cinco tratamientos (correspondientes a los diferentes fabricantes). 
Entonces, en este ejemplo, para cada poblacion, identificamos un tratamiento correspondiente. 
Ya sea que hayamos puesto en practica un diseno completamente aleatorizado o que hayamos 
tornado muestras independientes de cada una de varias poblaciones existentes, se establece una 
correspondencia biumvoca entre las poblaciones y los tratamientos. Estas dos situaciones, en las 
que se toman muestras independientes de cada una de las k poblaciones, son ejemplos de un 
diseno biunivoco. 


DEFINICION 12.5 


Un diseno biunivoco para comparar k poblaciones es un arreglo en el que se obtienen 
muestras aleatorias de cada una de las poblaciones de interes. 


En esta forma, un diseno biunivoco, ya sea que corresponda a datos obtenidos con el uso 
de un diseno completamente aleatorizado o al tomar muestras independientes de cada una de 
varias poblaciones existentes, es la extension de los experimentos muestrales independientes 
que consideramos en los Capitulos 8 y 10. Los metodos para analizar information obtenida de 
un diseno biunivoco se presentan en las Secciones 13.3 a la 13.7. 

En la Section 12.3 vimos que es frecuente que un diseno de observaciones pareadas sea 
un metodo superior para comparar las medias de dos poblaciones o tratamientos. Cuando 
estamos interesados en comparar las efectividades de dos medicamentos para controlar la 
hipertension, sugerimos formar observaciones pareadas de individuos que fueran del mismo 
sexo y de edades y pesos similares. Un miembro seleccionado al azar de cada par recibio el 
tratamiento 1, en tanto que otro recibio el tratamiento 2. La meta era controlar fuentes externas 
de variabilidad y asi obtener un analisis mas preciso. Suponga que deseamos comparar tres 
medicamentos diferentes y no solo dos. (Como procederiamos? En lugar de formar varios 
pares de individuos de caracterfsticas iguales, podrfamos formar varios grupos, cada uno de ellos 
con tres miembros igualados en cuanto a sexo, peso y edad. Dentro de cada grapo de tres, selec- 
cionariamos al azar un individuo para recibir el tratamiento 1 y otro para recibir el tratamiento 
2 y luego administrariamos el tratamiento 3 al miembro restante de cada grupo. El objetivo 
de este diseno es identico al del diseno de observaciones pareadas, es decir, eliminar fuentes 
no deseadas de variabilidad que podrian entrar de manera subrepticia en las observaciones de 
nuestro experimento. Esta extension del diseno de observaciones pareadas recibe el nombre 
de diseno aleatorizado en bloque. 
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DEFINICION 12.6 


FIGURA 12.3 
Diseno de bloque 
aleatorizado 


Un disefio aleatorizado en bloque contiene b bloques y k tratamientos consistentes de b 
bloques de k unidades experimentales cada uno. Los tratamientos se asignan de manera 
aleatoria a las unidades de cada bloque, con cada tratamiento apareciendo exactamente 
una vez en cada bloque. 


La diferencia entre un diseno de bloque aleatorizado y el diseno completamente aleatori¬ 
zado se puede demostrar al considerar un experimento disenado para comparar la reaccion de 
una persona a un conjunto de cuatro estfmulos (tratamientos), en un experimento psicologico 
de estimulo-respuesta. Denotaremos los tratamientos como 7), T 2 , T 3 y 7' 4 . 

Suponga que ocho personas se asignan al azar a cada uno de cuatro tratamientos. La asig- 
nacion aleatoria de personas a tratamientos (o viceversa) distribuye al azar errores debidos a la 
variabilidad de persona a persona en respuesta a los cuatro tratamientos y proporciona cuatro 
muestras que, para todos los fines practicos, son aleatorias e independientes. Este es un diseno 
experimental completamente aleatorizado. 

El error experimental asociado con un diseno completamente aleatorizado tiene varios 
componentes. Algunos de estos se deben a las diferencias entre personas, a que las medicio- 
nes repetidas de una persona no sean identicas (debido a variaciones en las condiciones ffsicas 
y psicologicas), a que el experimentador no administre un estimulo determinado con exacta¬ 
mente la misma intensidad en mediciones repetidas y a errores de medicion. La reduction de 
cualquiera de estas causas de error aumentara la information del experimento. 

La variacion de persona a persona del experimento anterior se puede eliminar con el uso de 
personas como bloques. Cada persona recibirfa cada uno de los cuatro tratamientos asignados 
en una secuencia aleatoria. El resultante diseno de bloque aleatorizado apareceria como en 
la Figura 12.3. Ahora solo ocho personas son necesarias para obtener ocho mediciones de 
respuesta por tratamiento. Observe que cada tratamiento ocurre exactamente una vez en cada 
bloque. 

La palabra aleatorizado en el nombre del diseno implica que los tratamientos son asigna¬ 
dos al azar dentro de un bloque. Para nuestro experimento, la posicion del bloque se refiere a 
la posicion en la secuencia de estfmulos asignada a una persona dada en el tiempo. El propo- 
sito de hacer aleatorio esto (es decir, la posicion del bloque) es eliminar el sesgo causado por 
fatiga o aprendizaje. 

Los bloques pueden representar tiempo, ubicacion o material experimental. Si se han de 
comparar tres tratamientos y se sospecha de la presencia de una tendencia en la respuesta 
media en el tiempo, una parte importante de la variacion tiempo-tendencia puede ser elimi- 
nada con bloques. Los tres tratamientos se aplicarfan al azar a unidades experimentales en un 
pequeno bloque de tiempo. Este procedimiento se repetirfa en bloques sucesivos de tiempo 
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hasta que se recolecte la cantidad de informacion necesaria. Una comparacion de la venta 
de productos competitivos en supermercados deberfa hacerse dentro de supermercados, 
usandolos como bloques y eliminando la variabilidad de tienda a tienda. Es frecuente que 
experimentos con animales en agricultura y medicina utilicen camadas como bloques, apli- 
cando todos los tratamientos, uno a cada uno, a los animales dentro de la camada. Debido 
a caracterfsticas hereditarias, los animales de una camada son mas homogeneos que los de 
varias camadas. Este tipo de bloque elimina la variacion de una camada a otra. El analisis 
de informacion generada por un diseno de bloque aleatorizado se analiza en las Secciones 
13.8 a 13.10. 

El diseno de bloque aleatorizado es solo uno de los muchos tipos de disenos de bloque. El 
diseno de bloques en dos direcciones se puede lograr con el uso de un diseno de cuadro latino. 
Supongamos que los individuos del ejemplo anterior se fatigaron cuando se les aplicaron los 
estfmulos, de modo que el ultimo estfmulo siempre produjo una respuesta mas baja que el pri- 
mero. Si esta tendencia (y la consecuente falta de homogeneidad de las unidades experimenta¬ 
les dentro de un bloque) fuera verdadera para todos los individuos, un diseno de cuadro latino 
serfa apropiado. El diseno se construirfa como se indica en la Figura 12.4. Cada estfmulo se 
aplica una vez a cada individuo y ocurre exactamente una vez en cada posicion del orden de 
presentacion. Los cuatro estfmulos se presentan en cada fila (renglon) y en cada columna de la 
configuration de 4 X 4. El diseno resultante es un cuadro latino de 4 X 4. Un diseno de cuadro 
latino para tres tratamientos requiere una configuracion de 3 X 3; en general, p tratamientos 
requieren un conjunto p X p de unidades experimentales. Si se desean mas observaciones 
por tratamiento, el experimentador debe usar varias configuraciones de cuadro latino en un 
experimento. En el ejemplo anterior serfa necesario correr dos cuadros latinos para obtener 
ocho observaciones por tratamiento. El experimento contendrfa entonces el mismo numero de 
observaciones por tratamiento que el diseno aleatorizado de bloques (Figura 12.3). 

Una comparacion de medias para cualquier par de estfmulos eliminarfa el efecto de la 
variacion de un individuo a otro, pero tambien eliminarfa el efecto de la tendencia de fatiga 
dentro de cada estfmulo porque cada tratamiento se aplicarfa en cada posicion de la secuencia 
de administrar estfmulos-tiempo. Por tanto, el efecto de la tendencia se cancelarfa al comparar 
las medias. Una exposition mas amplia de disenos de bloques y sus analisis esta contenida en 
los textos citados en la bibliograffa que aparece al final del capftulo. 

El objetivo de esta section ha sido presentar algunas de las consideraciones basicas al dise- 
nar experimentos. Hemos examinado el papel de la aleatorizacion en todos los experimentos 
bien disenados y nos hemos concentrado en las extensiones de las muestras independientes y 
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12.18 

12.19 

12.20 


12.21 

12.22 

12.23 

12.24 

12.25 

12.26 


experimentos de observaciones pareadas a situaciones en las que deseamos comparar mas de dos 
tratamientos. En particular, senalamos la existencia de disenos de bloques, como funcionan 
y como pueden producir aumentos importantes en la cantidad de information obtenida de un 
experimento al reducir variaciones perjudiciales. 


Ejercicios 

Dos medicamentos, A y B, se han de aplicar cada uno a cinco ratas. Suponga que las ratas estan nu- 
meradas del 1 al 10. Use la tabla de numeros aleatorios para asignar las ratas aleatoriamente a los dos 
tratamientos. 

Consulte el Ejercicio 12.18. Suponga que el experimento comprendla ties medicamentos, A, B y C, con 
5 ratas asignadas a cada uno. Use la tabla de numeros aleatorios para asignar aleatoriamente las 15 ratas 
a los tres tratamientos. 

Un ingeniero qulmico tiene dos catalizadores y tres temperaturas que desea usar en una serie de experi¬ 
mentos. 

a ^Cuantos tratamientos (combinaciones de factor-nivel) hay en este experimento? Describa cuidado- 
samente uno de estos tratamientos. 

b Cada experimento hace uso de una combination de catalizador-temperatura. Muestre la forma en 
que usaria una tabla de numeros aleatorios para hacer aleatorio el orden de los experimentos. 

De dos razones para utilizar la aleatorizacion en un experimento. 

^,Que es un factor! 

^Que es un tratamientos 

^Una variable podrfa ser un factor en un experimento y variable ruidosa (fuente de variation extrana) en 
otro? 

Si usted fuera a disenar un experimento, ^que parte del procedimiento de diseno aumentarfa la precision 
del experimento? ^Que parte del procedimiento de diseno disminuiria el impacto de fuentes extranas de 
variabilidad? 

Se realizara un experimento para comparar el efecto de la digitalina en la contraction del musculo 
cardiaco de ratas. El experimento se realiza al remover el corazon de una rata viva, cortar el corazon en 
capas delgadas y tratar las capas con dosis de digitalina; a continuation se mide la contraction muscu¬ 
lar. Si se van a emplear cuatro dosis, A, B, C y D. ^que ventaja se obtiene al aplicar A, B. C y D a una 
rebanada de tejido del corazon de cada rata? ^Que principio de diseno esta ilustrado por este ejemplo? 

Complete la asignacion de tratamientos para el siguiente diseno de cuadro latino de 3 X 3. 



A 


c 







12.27 
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12.5 Resumen 

El objetivo de este capftulo ha sido identificar los factores que afectan la cantidad de infor¬ 
macion en un experimento y usar este conocimiento para disenar mejores experimentos. El 
diseno de experimentos es un tema muy amplio y ciertamente dificil de condensar en un solo 
capftulo de un texto de introduccion. No obstante, la filosoffa que sirve de base al diseno, 
algunos metodos para variar informacion en un experimento y algunas estrategias deseables 
para diseno se explican con facilidad. 

Hemos visto que la cantidad de informacion relacionada con un parametro de interes de- 
pende de la seleccion de combinaciones factor-nivel (tratamientos) a incluir en el experimen¬ 
to, asf como de la asignacion del numero total de unidades experimentales a los tratamientos. 
La aleatorizacion es un componente importante de cualquier experimento de diseno, su uso 
ayuda a eliminar sesgos en resultados experimentales y proporciona la base teorica para cal- 
cular las probabilidades que son clave para el proceso de hacer inferencias. El procedimiento 
de bloque, es decir, comparar tratamientos dentro de bloques de material experimental rela- 
tivamente homogeneos, se puede usar para eliminar variacion de un bloque a otro cuando se 
comparan tratamientos. De esta manera, sirve como filtro para reducir el efecto de fuentes no 
deseadas de variabilidad. 

El analisis de algunos disenos experimentales elementales se aborda en el Capftulo 13. 
Un tratamiento mas extenso del diseno y analisis de experimentos es un curso por sf mismo. 
Si usted esta interesado en explorar este tema, consulte los textos citados en la bibliograffa 
recomendada. 


Bibliograffa y lecturas adicionales 

Box, G. E. P., W. G. Hunter, and J. S. Hunter. 2005. Statistics for Experimenters, 2d ed. New 
York: Wiley Interscience. 

Cochran, W. G., and G. Cox. 1992. Experimental Designs, 2d ed. New York: Wiley. 

Graybill, F. 2000. Theory and Application of the Linear Model. Belmont Calif.: Duxbury. 
Hicks, C. R., and K. V. Turner. 1999. Fundamental Concepts in the Design of Experiments, 
5th ed. New York: Oxford University Press. 

Hocking, R. R. 2003. Methods and Applications of Linear Models: Regression and the 
Analysis of Variance, 5th ed. New York: Wiley Interscience. 

Montgomery, D. C. 2006. Design and Analysis of Experiments, 6th ed. New York: Wiley. 

Scheaffer, R. L., W. Mendenhall, and L. Ott. 2006. Elementary Survey Sampling, 6th ed. 
Belmont Calif.: Duxbury. 

Scheffe, H. 2005. The Analysis of Variance. New York: Wiley Interscience. 


Ejercicios complementarios 

12.28 ^Como se puede medir la informacion en una muestra relacionada con un parametro poblacional espe- 
cffico? 

12.29 iQue es una muestra aleatorial 
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12.30 iQue factores afectan la cantidad de informacion en un experimento? /,Que procedimientos de diseno 
controlan estos factores? 

12.31 Consulte el experimento de observaciones pareadas de la Seccion 12.3 y suponga que la medicion que 
recibe el tratamiento i, donde i = 1 , 2 , en el /'-esimo par, donde j = 1 , 2 ,es 

Yij = n- + Pj + Ejj, 

donde = respuesta esperada para el tratamiento i, para i= 1,2. 

Pj = contribution de efecto aleatorio aditivo (positivo o negativo) por el /'-esimo par de unidades 
experimentales, para j = 1,2 

s - = error aleatorio asociado con la unidad experimental del /'-esimo par que recibe el tratamien¬ 
to i. 

Suponga que las eson variables aleatorias normales independientes con E (e,j) = 0, V (e^) = cr 2 \ 
y suponga que las son variables aleatorias normales independientes con E{Pj) = 0, V(Pj) — a 2 . 
Tambien, suponga que las P- y las e- son independientes. 

a Encuentre E(Y i} ). 

b Encuentre E(Y t ) y V(K,-), donde Y, es la media de las n observaciones que reciben el tratamiento i, 
donde i = 1,2. 

c Sea D = Y i — Y 2 . Encuentre E(D), V ( D ) y la distribucion de probabilidad para D. 

12.32 Consulte el Ejercicio 12.31. Demuestre que 

D y/n 

So 

tiene una distribucion t, dada H 0 : (/x, - /jl 2 ) = 0. 

*12.33 Consulte el Ejercicio 12.31. Suponga que un diseno completamente aleatorizado se utiliza para la com- 
paracion de las dos medias de tratamiento. Entonces, una respuesta podrfa ser modelada por la expre- 
sion 

Yjj im + Pij ~Y Sjj , 

pero el “efecto par” P- (que todavla afecta una unidad experimental) sera seleccionado aleatoriamente 
y es probable que difiera de una a otra de las 2 n observaciones que hay. Ademas, en contraste con el ex¬ 
perimento de observaciones pareadas, los efectos de par no se cancelaran cuando se calcule (Y t — Y 2 )- 
Compare V(Y i —Y 2 ) = V(D) para este diseno con el diseno de observaciones pareadas del Ejercicio 
12.31. /.Por que la varianza para el diseno completamente aleatorizado suele ser mas grande? 1 

12.34 A las personas que envfan trabajos de computacion a un centro de computo por lo general se les pide 
estimen la cantidad de tiempo de maquina necesario para completar el trabajo. Este tiempo se mide en 
unidades CPU, la cantidad de tiempo que un trabajo ocupara una parte de la memoria del CPU (unidad 
de procesamiento central) de la computadora. Un centro de computo decidio efectuar una comparacion 
de los tiempos de CPU estimado contra real para un cliente en particular. Los tiempos correspondientes 
estuvieron disponibles para 11 trabajos. Los datos muestrales se dan en la siguiente tabla. 


1. Los ejercicios precedidos de un asterisco son opcionales. 
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Numero de trabajo 




Tiempo de CPU 
(minutos) 1 

2 

3 

4 

5 6 

7 8 

9 

10 

11 

Estimado 

.50 

1.40 

.95 

.45 

.75 1.20 

1.60 2.6 

1.30 

.85 

.60 

Real 

.46 

1.52 

.99 

.53 

.71 1.31 

1.49 2.9 

1.41 

.83 

.74 


a ^Por que se esperarfa que las observaciones dentro de cada uno de estos pares de datos esten correla- 
cionadas? 

b ^Los datos dan suficiente evidencia para indicar que, en promedio, el cliente tiende a subestimar el 
tiempo de CPU necesario para calcular trabajos? Pruebe usando a = .10. 

c Encuentre el nivel de significance observado para la prueba e interprete este valor. 

d Obtenga un intervalo de confianza de 90% para la diferencia en tiempo medio estimado de CPU 
contra tiempo medio real de CPU. 

12.35 La temperatura de la Tierra afecta la germination de semillas, la supervivencia de cosechas en mal tiem¬ 
po y muchos otros aspectos de production agricola. La temperatura en varios lugares se puede medir 
usando sensores colocados en tierra o mediante dispositivos sensibles a rayos infrarrojos instalados en 
aviones o satelites espaciales. La captation de information de los sensores colocados en tierra es tediosa 
y requiere de numerosas replicas para obtener estimaciones precisas de la temperatura del suelo. Por 
otra parte, los sensores instalados en aviones o en satelites parecen introducir un sesgo en las lecturas de 
temperatura. Para estimar la cantidad de sesgo, ambos metodos se emplearon para medir la temperatura 
del suelo en cinco lugares. Las lecturas, medidas en grados Celsius, se dan en la siguiente tabla. 


Lugar 

Temperatura (°C) 

Suelo 

Aire 

1 

46.9 

47.3 

2 

45.4 

48.1 

3 

36.3 

37.9 

4 

31.0 

32.7 

5 

24.7 

26.2 


a ^La information presenta suficiente evidencia para decir que hay diferencia en el promedio de lectu¬ 
ras de la temperatura en tierra usando sensores instalados en tierra y en naves? 

b Construya un intervalo de confianza de 95% para la diferencia en lecturas medias de la temperatura 
del suelo usando sensores en tierra e instalados en las naves. 

c Deseamos estimar la diferencia entre lecturas medias de la temperatura para sensores instalados en 
tierra y en naves a no mas de .2°C en el nivel de confianza de 95%. ^Aproximadamente cuantas ob¬ 
servaciones pareadas (mediciones en diferentes lugares) se requieren? 

12.36 Se realizo un experimento para comparer el tiempo medio de reaction a dos tipos de senalamientos 
de transito: prohibido (no vuelta a la izquierda) y permitido (solo vuelta a la izquierda). Diez personas 
estuvieron incluidas en el experimento. A cada persona se le presentaron 40 senalamientos de transito, 
20 de prohibido y 20 de permitido, en orden aleatorio. El tiempo medio de reaction y el numero de ac- 
ciones correctas se registraron para cada persona. Los tiempos medios de reaction a los senalamientos 
de transito, 20 de prohibido y 20 de permitido para cada una de las personas, se reproducen en la tabla 
siguiente. 
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Persona 

Tiempos medios de reaction (ms) 
para 20 senalamientos de transito 

Prohibido 

Permitido 

1 

824 

702 

2 

866 

725 

3 

841 

744 

4 

770 

663 

5 

829 

792 

6 

764 

708 

7 

857 

747 

8 

831 

685 

9 

846 

742 

10 

759 

610 


a Explique por que este es un experimento de observaciones pareadas y de las razones por las cuales 
el pareamiento es util para aumentar information sobre la diferencia entre los tiempos medios de 
reaction a senalamientos de transito de prohibido y de permitido. 
b ^Los datos presentan suficiente evidencia para indicar una diferencia en los tiempos medios de reac¬ 
tion ante senalamientos de transito de prohibido y de permitido? Pruebe usando a = .05. 
c Encuentre e interprete el valor p aproximado para la prueba del inciso b. 

d Encuentre un intervalo de confianza de 95% para la diferencia en los tiempos medios de reaction 
para senalamientos de transito de prohibido y de permitido. 

*12.37 Supongamos que listed desea ajustar el modelo 

Y — p o + PiX + fiox 2 + e 


a un conjunto de n datos. Si los n datos han de asignarse a los puntos de diseno x = —1, 0 y 1, ^que 
fraction debe asignarse a cada valor de x para minimizar V (^ 2 )? (Suponga que n es grande y que k v k 2 
y k v + k 2 + k 2 = 1, son las fracciones del numero total de observaciones a ser asignadas a x = -1, 0 
y 1, respectivamente.) 






CAPITULO 13 
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13.2 Procedimiento del analisis de varianza 

13.3 Comparacion de mas de dos medias: analisis de varianza para un diseno de un factor 
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13.5 Modelo estadfstico para el diseno de un factor 
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13.8 Modelo estadfstico para el diseno de bloques aleatorizado 

13.9 El analisis de varianza para el diseno de bloques aleatorizado 

13.10 Estimacion en el diseno de bloques aleatorizado 

13.11 Seleccion del tamano muestral 

13.12 Intervalos de confianza simultaneos para mas de un parametro 

13.13 Analisis de varianza usando modelos lineales 

13.14 Resumen 

Bibliograffa y lecturas adicionales 


13.1 Introduccion 

La mayorfa de los experimentos comprenden un estudio del efecto de una o mas variables 
independientes sobre una respuesta. Las variables independientes que pueden ser controladas 
en un experimento reciben el nombre de factores y el nivel de intensidad de un factor se de- 
nomina nivel del factor. 

El analisis de los datos generados por un experimento multivariable requiere de la identifi¬ 
cation de las variables independientes del experimento. Estas no seran solo factores (variables 
independientes controladas) sino que tambien podrfan ser direcciones de bloqueo. Si estudiamos 
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las mediciones de desgaste para tres tipos de llantas. A, B y C, en cada uno de cuatro automo- 
viles, “tipos de llantas” es un factor que representa una sola variable cualitativa (no hay un 
valor cuantitativo o numerico asociado con la variable “tipo de llanta”) con tres niveles. Los 
automoviles son bloques y representan una sola variable cualitativa con cuatro niveles. La res- 
puesta para un diseno de cuadro latino depende de los factores que representan tratamientos, 
pero tambien son afectadas por dos variables cualitativas independientes de bloque, “bias” y 
“columnas.” 

Los metodos para disenar experimentos para aumentar la precision y controlar fuentes 
extranas de variacion se estudiaron en el Capftulo 12. En particular, se mostro que el diseno 
de un factor y el diseno de bloques aleatorizado eran generalizaciones de disenos simples para 
las muestras independientes y comparaciones pareadas de medias que se estudiaron en los 
Capftulos 8, 10 y 12. Los tratamientos corresponden a combinaciones de niveles de factor e 
identibcan las diferentes poblaciones de interes para el experimentador. Este capftulo presenta 
una introduction al analisis de varianza y da metodos para el analisis del diseno de un factor 
(incluyendo el diseno completamente aleatorizado) y disenos de bloque aleatorizados. Los 
metodos analogos de analisis para el diseno de cuadro latino no se presentan en este capftulo, 
pero pueden hallarse en los textos citados en la bibliograffa al bnal del capftulo. 


13.2 Procedimiento del analisis de varianza 

El metodo de analisis para experimentos que comprenden varias variables independientes 
puede explicarse si se desarrolla de manera intuitiva el procedimiento o bien, en forma mas 
rigurosa, por el metodo de modelos lineales desarrollado en el Capftulo 11. Empezamos por 
presentar una exposition intuitiva de un procedimiento conocido como analisis de varianza 
(ANOVA). Un resumen del metodo del modelo lineal se presenta en la Section 13.13. 

Como su nombre lo indica, el procedimiento ANOVA trata de analizar la variacion en un 
conjunto de respuestas y asignar partes de esta variacion a cada variable en un conjunto de va¬ 
riables independientes. Debido a que el experimentador raras veces incluye, si lo hace, todas 
las variables que afectan la respuesta en un experimento, la variacion aleatoria en las respues¬ 
tas se observa incluso si todas las variables independientes consideradas por el experimenta¬ 
dor se mantienen constantes. El objetivo del ANOVA es identibcar variables independientes 
importantes y determinar la forma en que afectan la respuesta. 

La logica del ANOVA puede comprenderse mejor con una explication abstracta. El anali¬ 
sis real, es decir, como hacerlo, se ilustra con un ejemplo. 

Al igual que en el Capftulo 11, la variabilidad de un conjunto de n mediciones es cuantih- 
cada por la suma de cuadrados de las desviaciones t (y ; — jy) 2 . El procedimiento ANOVA 
divide en partes esta suma de cuadrados de las desviaciones, llamada suma total de cuadra¬ 
dos, cada una de las cuales se atribuye a una de las variables independientes del experimento, 
mas un residuo que esta asociado con error aleatorio. La Figura 13.1 ilustra esa division para 
tres variables independientes. Si se escribiera un modelo lineal multivariable para la respues¬ 
ta, como se sugiere en el Capftulo 11, la parte de la suma total de los cuadrados del error se 
denomina suma de cuadrados asignada al error (SSE). 

Para los casos que consideramos y dada la hipotesis de que las variables independientes 
no estan relacionadas con la respuesta, cada una de las partes de la suma total de cuadrados, 
dividida entre una constante apropiada, da como resultado un estimador independiente e in- 
sesgado de <x 2 , la varianza del error experimental. Cuando una variable esta altamente relacio- 
nada con la respuesta, su parte de la suma total de cuadrados (llamada suma de cuadrados de 
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FIGURA 13.1 
Division de la suma 
total de cuadrados 
de las desviaciones 



la variable) aumentara. Esta condition puede detectarse si se compara la suma de cuadrados 
para esa variable con la suma de cuadrados del error, SSE. La prueba estara basada en un es- 
tadistico que posee una distribution F y especifica que la hipotesis de que no hay efecto para 
la variable independiente debe ser rechazada si el valor de F es grande. 

El mecanismo del ANOVA puede ilustrarse mejor si se considera un ejemplo conocido. 
Suponga que deseamos usar information en muestras independientes de tamanos n i = n 2 
para comparar las medias de dos poblaciones distribuidas normalmente con medias /i^ /jl 2 
y varianzas iguales of = of = cr 2 . Este experimento, ya antes analizado con el uso de la 
prueba t de muestras independientes, se abordara ahora desde otro punto de vista. La variation 
total de las mediciones de respuesta de las dos muestras es cuantificada por (recuerde que 
«i = n 2 ) 


SS total = f] X>7 ~Y) 2 = J2 X>7 - y ) 2 ’ 

i=i j =l i=i j=l 

donde Y- denota la j-esima observation de la z-esima muestra y Y es la media de todas las 
n = 2n l observaciones. Esta cantidad puede dividirse en dos partes de la siguiente manera: 


2 «i 

SS total = E^-n 2 
i=l 2=1 

= n 1 J2(Yi-Y) 2 + j^^iYij-Ytf 

i=i i=i j =l 


SST 


SSE 


(prueba diferida a la Section 13.6), donde Y, es el promedio de las observaciones de la /-esima 
muestra, para i = 1,2. Examinemos la cantidad SSE mas de cerca. Recuerde que hemos su- 
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puesto que las varianzas poblacionales subyacentes son iguales y que n l = n 2 . 

SSE = E X>y - E ') 2 = X>i - 

i =1 7=1 / = 1 

= (n 1 -l)S 1 2 +(n 1 -l)S|, 

donde 


si 2 = 


Ml 


1 1 

rrD^- 

7=1 


E,) 2 . 


Recuerde que, en el caso m, = m 2 , el estimador “agrupado” para la varianza comun cr 2 esta 
dado por 


2 = (»1 - 1)S 2 + (m 2 - 1)S 2 = (M! - 1)S 2 +(M! - 1)S 2 = SSE 
p n\ + ri 2 — 2 ni + n\ — 2 2m \ — 2 


Hemos dividido la suma total de cuadrados de las desviaciones en dos partes. Una parte, SSE, 
puede dividirse entre 2m, — 2 para obtener el estimador agrupado de cr 2 . Debido a que hay 
solo dos tratamientos (o poblaciones) v n , = n 2 , la otra parte, 

2 

SST = M!^(F,- - E) 2 = y(7i - E 2 ) 2 , 


la suma de cuadrados de los tratamientos (SST), sera grande si E \ — T 2 | es grande. En 
consecuencia, cuanto mas grande sea SST, mayor sera el peso de la evidencia para indicar 
una diferencia entre /jl 1 y /x 2 . ^Cuando sera la SST suficientemente grande para indicar una 
diferencia importante entre /x., y /j, 2 ? 

Debido a que hemos supuesto que Y- esta distribuida normalmente con E( Y :j ) = /x,,, para i 
= 1, 2 y V (K) = cr 2 y como SSE/(2 m , — 2) es identica al estimador agrupado de cr 2 emplea- 
do en los Capftulos 8 y 10 se deduce que 


E 


SSE 

2ii\ — 2 


= cr 


2 


y que 


SSE _ 
cr 2 4—t 

7 = 1 




- E0 2 ,!l 

r 2 

7=1 




t 2 ) 2 


tiene una distribution x 2 con 2m, - 2 grados de libertad (gl) (vea la Seccion 8.8). 
En la Seccion 13.6 obtendremos un resultado que implica que 


E(SST) = cr 2 + y(/X! -/x 2 ) 2 . 

Observe que la SST estima cr 2 si /jl 1 = /x 2 y una cantidad mayor que cr 2 si /x i ¥= /x 2 . Dada la 
hipotesis de que /j. , = /x 2 , se deduce que 

El - E 2 


Z = 


y/lcr 1 jn\ 
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tiene una distribution normal estandar; por tanto. 


( n '\ 

~(Y l -Y 2 ) 2 ~ 

V 2 ) 

a 2 


SST 

a 2 


tiene una distribution x 2 con 1 grado de libertad. 

Observe que la SST es una funcion solo de las medias muestrales Y\ y Y 2 en tanto que la 
SSE es una funcion solo de las varianzas muestrales S 2 y Sf .El Teorema 7.3 implica que, para 
i = 1,2, las medias muestrales Y, y las varianzas muestrales Sf son independientes. Como se 
supone que las muestras son independientes, se deduce que la SST y la SSE son variables alea- 
torias independientes. En consecuencia, de la Definition 7.3, de acuerdo con la hipotesis de que 
Mi = M 2 > 




(2«i - 2) 


SST/1 

SSE/(2«i -2) 


tiene una distribution F con v x = I grado de libertad en el numerador y v 2 = (2n ] - 2) grados 
de libertad en el denominador. 

Las sumas de cuadrados divididas entre sus respectivos grados de libertad reciben el nom- 
bre de cuadrados medios. En este caso, el cuadrado medio del error y el cuadrado medio de 
los tratamientos estan dados por 


MSE 


SSE 
2n x — 2 


MST = 


SST 


de acuerdo con H 0 : /jl x = /jl 2 , MST y MSE representan estimaciones de cr 2 . No obstante, cuan- 
do H 0 es falsa y /jl 1 A /jl 2 , MST constituye una estimation de una cantidad mayor que cr y tiende 
a ser mas grande que MSE. Para probar H 0 : /jl 1 = j± 2 contra H u : /.c, A /jl 2 , usamos 


MST 

F = - 

MSE 


como el estadlstico de prueba. 

El desacuerdo con la hipotesis nula esta indicado por un valor grande de F; en consecuen¬ 
cia, la region de rechazo para una prueba con nivel de significancia a es 


Entonces, la prueba ANOVA resulta en una prueba F de una cola. Los grados de libertad 
para F son los asociados con MST y MSE. En este ejemplo, como ya antes indicamos, F esta 
basada env, = l y v 2 = 2n x - 2 grados de libertad en numerador y denominador, respectiva- 
mente. 

Para el problema de dos muestras en consideration, la prueba F que acabamos de describir 
es equivalente a la prueba t de dos colas del Capftulo 10. Entonces, ( \por que molestarse en 
establecer esta equivalencia? Como veremos en la Section 13.3, la prueba F facilmente se 
generaliza para permitir una comparacion de cualquier numero de tratamientos. 


EJEMPLO 13.1 Los valores codificados para una medida de elasticidad de un plastico preparado por dos 
procesos diferentes se proporcionan en la Tabla 13.1. Las muestras independientes, ambas 
de tamano 6, se tomaron de la production de cada uno de los procesos. ( \Los datos presentan 
suficiente evidencia para indicar una diferencia en elasticidad media en los dos procesos? 
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Tabla 13.1 

Datos para el Ejemplo 13.1 


A 

B 

6.1 

9.1 

7.1 

8.2 

7.8 

8.6 

6.9 

6.9 

7.6 

7.5 

8.2 

7.9 


Solucion Aunque la prueba t de dos muestras de la Seccion 10.8 podrfa usarse para analizar estos datos, 
usaremos la prueba F ANOVA estudiada antes en esta seccion. Las tres sumas de cuadrados 
buscadas son 


SS total 


SST 

SSE 


EE^-y) 2 = EE^-^ 


>' = 1 7=1 


« = 1 7=1 
\2 _ 


711.35 - —(91.9L = 7.5492, 
12 



2 


2 2 

n\ Yjdt ~ v> 2 = 6 _ y) 1 = L6875 > 

/=1 i =1 

2 6 

£E ( - V ‘7-^) 2 = 5 - 8617 - 

< =1 7=1 


(Usted puede verificar que la SSE es la suma de cuadrados de las desviaciones agrupada para 
las dos muestras y que la SS total = SST + SSE.) Los cuadrados medios del tratamiento y el 
error son, respectivamente 


MST 

MSE 


SST _ 

SSE 
2n i — 2 


1.6875, 

5.8617 


.58617. 


Para probar la hipotesis nula /a, = /i 2 , calculamos el valor del estadfstico de prueba 


MST 

MSE 


1.6875 

.58617 


2.88 


y rechazamos H 0 si el valor calculado de F excede a F a . El valor critico del estadfstico F con 
1 grado de libertad en el numerador y 10 grados de libertad en el denominador para a = .05 y 
F 05 = 4.96. Aunque el cuadrado medio del tratamiento (MST) es casi tres veces el cuadrado 
medio del error (MSE), no es suficientemente grande para permitir el rechazo de la hipotesis 
nula. En consecuencia, en el nivel de significancia a = .05, no hay suficiente evidencia para 
indicar una diferencia entre /jl 1 y /jl 2 . El nivel de significancia alcanzado esta dado por el valor 
p = P(F> 2.88). De acuerdo con la Tabla 7, Apendice 3, valor p > . 10. La aplicacion F-Ratio 
Probabilities and Quantiles proporciona el valor p exacto = P(F > 2.88) = .12054. 

El proposito de este ejemplo es ilustrar los calculos comprendidos en un ANOVA sencillo. 
La prueba F para comparar dos medias es equivalente a una prueba t de dos muestras porque 
el cuadrado de una variable aleatoria con distribucion t con v grados de libertad tiene una dis- 
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tribucion F con 1 grado de libertad en el numerador y v grados de libertad en el denominador. 
Usted puede verificar facilmente que el cuadrado de 1 025 = 2.228 (empleado para la prueba de 
dos colas con a = .05 y v = 10 grados de libertad) es igual a F os = 4.96. Si se hubie- 
ra usado la prueba t para el Ejemplo 13.1, hubieramos obtenido t = -1.6967, que satisface 
la relation f 2 = (1.6967) 2 = 2.88 = F. U 


Ejercicios 

13.1 Los tiempos de reaction para dos estfmulos diferentes en un experimento psicologico de asociacion de 
palabras se compararon usando cada estfmulo en muestras aleatorias independientes de tamano 8. Asf, 
un total de 16 personas se usaron en el experimento. ^Los siguientes datos presentan suficiente evidencia 
para indicar que hay una diferencia en los tiempos medios de reaction para los dos estfmulos? 


Estfmulo 1 

1 

3 

2 

1 

2 13 2 

Estfmulo 2 

4 

2 

3 

3 

12 3 3 


a Use el metodo ANOVA para probar las hipotesis apropiadas. Prueba en el nivel a = .05 de signifi- 
cancia. 

b Ejercicio Applet Use la aplicaion F-Ratio Probabilities and Quantiles para determinar el valor p 
exacto para la prueba del inciso a. 

c Pruebe las hipotesis apropiadas con el uso de la prueba t de dos muestras para comparar medias po- 
blacionales que desarrollamos en la Section 10.8. Compare el valor del estadfstico t contra el valor 
del estadrstico F calculado en el inciso a. 

d iQue suposiciones son necesarias para las pruebas realizadas en incisos anteriores? 

13.2 Consulte los Ejercicios 8.90 y 10.77. 

a Use una prueba F para determinar si hay suficiente evidencia para expresar una diferencia en las 
medias de las calificaciones SAT verbales, de estudiantes de secundaria que pretendan especializarse 
en ingenierfa y lengua-literatura. Defina lfmites para el valor p asociado. ^Que concluirfa usted con 
un nivel de significancia a = .05? 

b Ejercicio Applet Use la aplicacion F-Ratio Probabilities and Quantiles para determinar el valor p 
exacto para la prueba del inciso a. 

c ^Como se compare el valor del estadfstico F obtenido en el inciso a contra el valor del estadfstico t 
obtenido en el Ejercicio 10.77? 

d f,Que suposiciones son necesarias para los analisis efectuados en el inciso a? 

13.3 Comparacion de mas de dos medias: 
analisis de varianza para un diseno 
de un factor 

Un ANOVA para comparar mas de dos medias poblacionales es una generalization del 
ANOVA presentado en la Section 13.2. La selection aleatoria de muestras independientes de 
k poblaciones se conoce como diseno de un factor. Como se indica en la Section 12.4, los da¬ 
tos en un diseno de un factor pueden corresponder a datos obtenidos de un diseno experimen- 
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tal completamente aleatorizado (vease la Definition 12.4) o de tomar muestras independientes 
de cada una de varias poblaciones existentes. 

Suponga que muestras aleatorias independientes se han sacado de k poblaciones normales 
con medias /x 2 , ..., p, k , respectivamente, y varianza comun a 2 . Para que sean completa¬ 
mente generales, permitiremos que los tamanos muestrales sean desiguales y que zz ; , para i = 
1,2 ,k sea el numero de observaciones de la muestra tomadas de la z-esima poblacion. El 
numero total de observaciones del experimento es n = n l + n 2 + ■ ■ ■ + n k . 

Denotemos con Y i} la respuesta para la j-esima unidad experimental de la z-esima muestra 
y representemos con 1% y Y,, el total y la media, respectivamente, de las zz ; respuestas en la 
z-esima muestra. El punto en la segunda position del subfndice de K,. tiene la finalidad de 
recordar al lector que esta cantidad se calcula sumando todos los posibles valores del subfndi- 
ce que es sustituido por el punto, j en este caso. Del mismo modo, los subindices de Y, , indican 
que esta media se calcula promediando los valores de la z-esima muestra. Entonces, para i = 
1,2,..., k. 


Yi. = 'E Y U 

j =i 




Yi.. 


Esta modificacion de los slmbolos para totales y promedios muestrales simplificara las formu¬ 
las de calculo para las sumas de cuadrados. 

Entonces, como en el ANOVA que contiene dos medias, tenemos 

SS total = SST + SSE 

(demostracion diferida a la Section 13.6), donde 


SS total = J2 J2(Y U ~Y) 2 = J2 Y/iJ ~ CM 


= 1 7=1 


CM = 


(total de todas las observaciones)' 




(el simbolo CM denota correction para la media). 


k 

SST = Y j n i (Y i .-Y) 2 

i =1 

k y 2 

= Y~ ~ CM ’ 

frf tii 

SSE = SS total - SST. 



Aunque la forma mas facil de calcular la SSE es por sustraccion, como ya vimos antes, es 
interesante observar que la SSE es la suma agrupada de cuadrados para todas las k muestras 
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y es igual a 


donde 


SSE 


k rii 


EE (^- y ") 2 



S ; 2 = 


n, 


7=1 


E /.) 2 


Observe que la SSE es una funcion solo de las varianzas muestrales Sf, para i = 1,2,..., C 
Como cada uno de los Sj valores proporciona un estimador insesgado para erf = a 2 con n t — 1 gra- 
dos de libertad, un estimador insesgado de cr 2 basado en (n \ + no + ■ ■ ■ + n k — k) = n — k 
grados de libertad esta dado por 


S 2 = MSE 


SSE 

(«i - 1) + (n 2 - 1) H- +(n k - 1) 


SSE 
n — k 


Como 


Y 


1=1 7=1 



se deduce que SST es una funcion solo de las medias muestrales Y,., para i = 1,2,..., k. El 
MST posee (k — 1) grados de libertad, es decir, 1 menos que el numero de medias, y es 


MST 


SST 

k — r 


Para probar la hipotesis nula. 


H 0 ■ Mi = P-2 = • ' • = Mi- 


contra la alternativa de que al menos una de las igualdades no se cumple, comparamos MST 
con MSE, usando el estadfstico F con base en iq = k — 1 y v, = n — k grados de libertad en 
el numerador y el denominador, respectivamente. La hipotesis nula sera rechazada si 


MST 

MSE 



donde F a es el valor crftico de F para una prueba de nivel cr. En el Ejercicio 13.6 usted demos- 
trara que dada H 0 : /j, 1 = /j, 2 = ■ ■ ■ = /-q, el estadfstico F posee una distribucion F con k -- I y 
n — k grados de libertad en el numerador y el denominador, respectivamente. 
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De acuerdo con las convenciones que establecimos, usaremos la notacion y~ para denotar el 
valor observado de Y-. Del mismo modo, usaremos v,. y y,, para denotar los valores observados 
de Y,, y 7,.,para i = 1, 2,..., k, respectivamente. De manera intuitiva, cuanto mayores sean 
las diferencias entre los valores observados de las medias de tratamiento, y x ., y 2 „ ■ ■ ., y 
mayor es la evidencia para indicar una diferencia entre las medias poblacionales correspon- 
dientes. Si todas las medias de tratamiento son identicas, y u = y 2 . = ■■ ■ = y kt = y y todas 
las diferencias que aparecen en la expresion anterior para SST son iguales a cero, implica que 
SST = 0. Conforme las medias para tratamiento se alejan entre si, las desviaciones (y,.— y) 
aumentan en valor absoluto y el valor observado de la SST aumenta en magnitud. En conse- 
cuencia, cuanto mayor sea el valor observado de la SST, mayor es el peso de la evidencia que 
hay a favor de rechazar la hipotesis nula. Esta misma lfnea de razonamiento se aplica a las 
pruebas F empleadas en el ANOVA para todos los experimentos disenados. 

Las suposiciones que sirven de base a las pruebas F del ANOVA merecen particular aten- 
cion. Se supone que las muestras aleatorias independientes han sido seleccionadas de las k 
poblaciones. Se supone que las k poblaciones estan distribuidas normalmente con varianzas 
of = of = ’' ’ = of = a 2 y medias fjb v /jl 2 ,..., fi k . Las desviaciones moderadas respecto 
de estas suposiciones no afectaran de manera grave las propiedades de la prueba. Esto es par- 
ticularmente cierto en la suposicion de normalidad. La suposicion de varianzas poblacionales 
iguales es menos crftica si los tamanos de las muestras de las poblaciones respectivas son 
todos iguales (n l = n 2 = ■ ■ ■ = n k ). Se dice que un diseno de un factor con igual numero de 
observaciones por tratamiento esta balanceado. 


EJEMPLO 13.2 Cuatro grupos de estudiantes se someten a diferentes tecnicas de ensenanza y se examinan al 
final de un periodo especificado. Como consecuencia de las deserciones de los grupos expe- 
rimentales (por enfermedad, transferencia, etc.), el numero de estudiantes vario de un grupo 
a otro. ( ',Los datos mostrados en la Tabla 13.2 presentan suficiente evidencia para indicar una 
diferencia en el exito medio para las cuatro tecnicas de ensenanza? 


Solucion Los valores observados de las cantidades necesarias para calcular el valor del estadfstico F 
son 


CM 

SS total 

SST 

SSE 




(1779) 2 

23 


= 137 601.8, 


4 tt; 


~ cm = 139 511 - 137 601 8 = 1909.2, 

i=i j =i 


4 Of. 


Y;— - CM = 138 314.4 - 137 601.8 = 712.6, 

Hi¬ 
ss total -SST = 1196.6. 


Los valores observados de MST y MSE son 


MST 

MSE 


SST 
k - 1 
SSE 
n — k 


712.6 

3 " 

1196.6 
19 


237.5, 
= 63.0. 








13.4 Tabla de analisis de varianza para un diseno de un factor 671 


Tabla13.2 Datos para el Ejemplo 13.2 



1 

2 

3 

4 


65 

75 

59 

94 


87 

69 

78 

89 


73 

83 

67 

80 


79 

81 

62 

88 


81 

72 

83 



69 

79 

76 




90 



7i. 

454 

549 

425 

351 

n t 

6 

7 

6 

4 

Ji. 

75.67 

78.43 

70.83 

87.75 


Finalmente, el valor observado del estadfstico de prueba para probar la hipotesis nula H 0 : 
Mi = M 2 = Ma = M 4 es 

MST 237.5 

F = - = - = 3.77, 

MSE 63.0 

donde los grados de libertad apropiados en el numerador y el denominador son v l = k — 1 = 
3 y v-, = n — £ = (6+ 7 + 6 +4) — 4=19, respectivamente. 

El nivel de significancia alcanzado esta dado por valor p = P(F > 3.77). Usando la Tabla 
7, Apendice 3, con 3 grados de libertad en el numerador y 19 en el denominador, vemos que 
.025 < valor p < .05. Entonces, si escogemos a = .05 (o cualquier valor mayor), rechazamos 
la hipotesis nula y concluimos que hay suficiente evidencia para indicar una diferencia en el 
exito medio entre los cuatro procedimientos de ensenanza. La aplicacion F-Rcitio Probabilities 
and Quantiles se puede usar para establecer el valor p exacto = P(F > 3.77) = .02808. ■ 


Usted puede pensar que esta conclusion pudo hacerse con base en la observacion visual de 
las medias de tratamiento. Sin embargo, no es dificil construir un conjunto de datos que lleve 
a resultados erroneos a quien tome decisiones visuales. 


13.4 Tabla de anal isis de varianza para un diseno 
de un factor 

Los calculos para un ANOVA suelen mostrarse en una tabla ANOVA (o AOV). La tabla para 
el diseno en la Seccion 13.3 para comparar k medias de tratamiento se ilustra en la Tabla 13.3. 
La primera columna muestra la fuente asociada con cada una de las sumas de cuadrados; la 
segunda columna da los grados de libertad respectivos; las columnas tercera y cuarta dan las 
sumas de cuadrados y cuadraticas medias, respectivamente. Un valor calculado de F, com- 
parando MST y MSE, suele aparecer en la quinta columna. Observe que SST + SSE = SS 
total y que la suma de grados de libertad del tratamiento y del error es igual al numero total 
de grados de libertad. 
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Tabla 13.3 Tabla ANOVA para diseno de un factor 


Fuente 

gl 

ss 

MS 

F 

Tratamientos 

k - 1 

SST 

SST 

MST - 

k - 1 

MST 

MSE 

Error 

n — k 

SSE 

SSE 

MSE - 





n — k 




k rij 



Total 

n — 1 

J2 E ( 7o - yf 





i = l 7 = 1 




Tabla 13.4 Tabla ANOVA para el Ejemplo 13.2 


Fuente 

gl 

SS 

MS 

F 

Tratamientos 

3 

712.6 

237.5 

3.77 

Error 

19 

1196.6 

63.0 


Total 

22 

1909.2 




La tabla ANOVA para el Ejemplo 13.2, que se muestra en la Tabla 13.4, constituye una 
forma de presentation compacta de las cantidades calculadas apropiadas para el analisis de 
varianza. 


Ejercicios 

13.3 Enuncie las suposiciones que sirven de base al ANOVA de un diseno completamente aleatorizado. 

13.4 Consulte el Ejemplo 13.2. Calcule el valor de la SSE al agrupar las sumas de los cuadrados de las des- 
viaciones dentro de cada una de las cuatro muestras y compare la respuesta con el valor obtenido por 
sustraccion. Esta es una extension del procedimiento de agrupacion empleado en el caso de dos muestras 
estudiado en la Section 13.2. 

*13.5 En el Ejercicio 6.59 mostramos que si Pj y Y 2 son variables aleatorias independientes con distribucion 
X 2 , con Vj y v 2 grados de libertad, respectivamente, entonces lj + Y 2 tienen una distribucion x 2 con iq 
+ v, grados de libertad. Ahora suponga que W = U + V, donde U y V son variables aleatorias indepen¬ 
dientes, y que W y V tienen distribuciones x 2 con ry s grados de libertad, respectivamente, donde r > s. 
Use el metodo de funciones generadoras de momentos para demostrar que U debe tener una distribucion 
X 2 con r — s grados de libertad . 1 

13.6 Suponga que muestras independientes de tamanos n v n k se toman de cada una de las k pobla- 

ciones distribuidas normalmente con medias p 1 , pt 2 ,..., p. k y varianzas comunes, todas iguales a a 2 . 
Denotemos con Yy lay-esima observation de la poblacion i, para j — 1,2,, n i e i = 1,2,..,, k, y sea 
n = rii + n 2 + ■ ■ ■ + 
a Recuerde que 


k J n i 

SSE = J2(n, ~ 1 )Sf donde S 2 = - 7,-.) 2 . 

1=1 1 7=1 

Demuestre que SSE/cr 2 tiene una distribucion x 2 con (n t — 1) +{n 2 — 1)+ • ■ ■ +(n k — 1) = n —k gra¬ 
dos de libertad. 


1. Los ejercicios precedidos por un asterisco son opcionales. 
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b Demuestre que de acuerdo con la hipotesis nula, H 0 : /z, = p 2 = • • • = pt k todas las Yy son varia¬ 
bles aleatorias independientes y distribuidas normalmente con la misma media y varianza. Use el 
Teorema 7.3 para demostrar ademas que, dada la hipotesis nula, 

k rij 

SS Total = 

i =1 1=1 

es tal que (SS total) /a 2 dene una distribution x 2 con n — 1 grados de libertad. 

c En la Section 13.3 dijimos que la SST es una funcion solo de las medias muestrales y que la SSE es 
una funcion solo de las varianzas muestrales. En consecuencia, las SST y SSE son independientes. 
Recuerde que SST total = SST + SSE. Use los resultados del Ejercicio 13.5 y los incisos a y b para 
demostrar que, dada la hipotesis H 0 : /jl { = /x-, = • • • = p, k , SST/cr 2 tiene una distribution x 2 con k— 1 
grados de libertad. 

d Use los resultados de los incisos a-c para afirmar que, de acuerdo con la hipotesis H 0 : /x l = p. 2 = • ■ ■ 
= jx k , F = MST/MSE tiene una distribution F con k — 1 y n - k grados de libertad en el numerador 
y el denominador, respectivamente. 

13.7 Cuatro plantas qulmicas, que producen los mismos productos y son propiedad de la misma companla, 
descargan aguas residuales en arroyos en la cercanla donde se encuentran ubicadas. Para vigilar la mag- 
nitud de la contamination creada por las aguas residuales y para determinar si esto difiere de una planta 
a otra, la companla recolecto aleatoriamente muestras de desechos llquidos, cinco muestras de cada 
planta. Los datos se presentan en la siguiente tabla. 


Planta Aguas residuales contaminantes (lb/gal de desechos) 


A 

1.65 

1.72 

1.50 

1.37 

1.60 

B 

1.70 

1.85 

1.46 

2.05 

1.80 

C 

1.40 

1.75 

1.38 

1.65 

1.55 

D 

2.10 

1.95 

1.65 

1.88 

2.00 


a ^La information aporta suficiente evidencia para indicar una diferencia en el peso medio de las aguas 
residuales por galon descargadas de las cuatro plantas? Pruebe usando a = .05. 

b Ejercicio Applet Encuentre el valor p asociado con la prueba del inciso a usando la aplicacion 
F-Ratio Probabilities and Quantiles. 

13.8 En un estudio de salarios iniciales para profesores auxiliares, cinco profesores auxiliares hombres de 
tres tipos de instituciones que otorgan doctorados se encuestaron aleatoriamente; se registraron sus sala¬ 
rios iniciales pero sus nombres se mantuvieron en el anonimato. Los resultados de la encuesta (medidos 
en miles de dolares) se proporcionan en la tabla siguiente. 2 


Universidades 

publicas 

Privadas-independientes 

Afiliadas 
a la iglesia 

49.3 

81.8 

66.9 

49.9 

71.2 

57.3 

48.5 

62.9 

57.7 

68.5 

69.0 

46.2 

54.0 

69.0 

52.2 


2. Fuente: adaptado de “Average Salary for Men and Women Faculty, by Category, Affiliation, and Academy Rank 
2002-2003,” Academe: Bulletin of the American Association of University Professors, marzo-abril de 2003, 37. 
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a ^Que tipo de diseno experimental se utilizo cuando se recolectaron los datos? 

b l, H ay suficiente evidencia para indicar una diferencia en el promedio de los salarios iniciales de pro- 
fesores auxiliares en los tres tipos de instituciones que otorgan doctorados? Use la tabla de la prueba 
para limitar el valor p. 

c Ejercicio Applet Determine el valor p exacto con el uso de la aplicacion F-Ratio Probabilities and 
Quantiles. 

13.9 En una comparacion de las resistencias del concreto producido con cuatro mezclas se prepararon tres 
muestras de cada tipo de mezcla. Cada una de las 12 muestras fue sometida a cargas de compresion cada 
vez mayores hasta romperlas. La siguiente tabla proporciona las cargas de compresion, en toneladas 
por pulgada cuadrada, alcanzadas en el punto de ruptura. Los numeros de muestra 1-12 estan indicados 
entre parentesis para fines de identification. 


Mezcla A 

Mezcla B 

Mezcla C 

Mezcla D 

(1)2.30 

(2) 2.20 

(3) 2.15 

(4) 2.25 

(5) 2.20 

(6)2.10 

(7) 2.15 

(8) 2.15 

(9) 2.25 

(10) 2.20 

(11)2.20 

(12) 2.25 


a Analice la information suponiendo que se satisfacen las necesidades para un diseno de un factor. 
Diga si hay apoyo estadfstico con un nivel de significance a = .05 para la conclusion de que al 
rnenos uno de los concretos difiere en resistencia promedio con respecto a los otros. 

b Ejercicio Applet Use la aplicacion F-Ratio Probabilities and Quantiles para hallar el valor p asocia- 
do con la prueba del inciso a. 

13.10 Un psicologo clfnico deseaba comparar tres metodos para reducir los niveles de hostilidad en estudiantes 
universitarios. Se utilizo un examen psicologico (HLT) para medir el grado de hostilidad. Puntuaciones 
altas en este examen indican gran hostilidad; en el experimento se emplearon once estudiantes que 
obtienen calificaciones altas y casi iguales. Cinco se tomaron aleatoriamente de entre los 11 casos pro- 
blema y fueron tratados por el metodo A. Tres se tomaron aleatoriamente de los 6 estudiantes restantes 
y fueron tratados por el metodo B. Los otros 3 estudiantes fueron tratados por el metodo C. Todos los 
tratamientos continuaron durante un semestre. A cada estudiante se le aplico un examen HLT de nuevo 
al finalizar el semestre con los resultados mostrados en la siguiente tabla. 


Metodo A 

Metodo B 

Metodo C 

73 

54 

79 

83 

74 

95 

76 

71 

87 

68 



80 




a ^Los datos aportan suficiente evidencia para indicar que al menos uno de los metodos de tratamiento 
produce una respuesta media del estudiante diferente de los otros metodos? Fije lfmites para el nivel 
de significancia alcanzado. 

b Ejercicio Applet Determine el valor p exacto con el uso de la aplicacion F-Ratio Probabilities and 
Quantiles. 

c ^Que concluirfa usted en el nivel de significancia a = .05? 

13.11 Se cree que las mujeres en la fase posmenopausica de su vida sufren de deficiencia de calcio. Este 
fenomeno esta asociado con la proportion relativamente alta de fracturas de hueso en mujeres de ese 
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grupo de edad. ^La deficiencia de calcio esta asociada con la deficiencia de estrogeno, afeccion que se 
presenta despues de la menopausia? Para investigar esta teorfa, L. S. Richelson y colegas 3 compararon 
la densidad mineral en huesos de tres grupos de mujeres. 

El primer grupo de 14 mujeres habla padecido de ooforectomla (extirpation quirurgica de ovarios) 
durante su edad adulta joven y habla vivido un periodo de 15 a 25 anos con deficiencia de estrogeno. 
Un segundo grupo, identificado como premenopausico, tenia mas o menos la misma edad (aproximada- 
mente 50 anos) que el grupo de ooforectomla, excepto que las mujeres nunca hablan sufrido un periodo 
de deficiencia de estrogeno. El tercer grupo de 14 mujeres eran posmenopausicas y hablan sufrido de 
deficiencia de estrogenos durante un promedio de 20 anos. La media y el error estandar de la media para 
las tres muestras de mediciones de densidad osea en la espina dorsal, es decir, 14 mediciones en cada 
muestra, una por cada persona, se registraron en la siguiente tabla. 


Ooforectomla 
grupo 1 

Premenopausicas 
grupo 2 

Posmenopausicas 
grupo 3 

Media 

Error estandar 

Media Error estandar 

Media 

Error estandar 

0.93 

0.04 

1.21 0.03 

0.92 

0.04 


a l,Hay suficiente evidencia que permita concluir que las mediciones medias de densidad osea difieren 

para los tres grupos de mujeres? ^,Cual es el valor p asociado con su prueba? 

b iQue concluirla listed con un nivel de significancia a = .05? 

13.12 Si las legumbres destinadas al consumo humano contienen algun plaguicida, este debe presentarse en 
cantidades pequenlsimas. La detection de plaguicidas en legumbres enviadas al mercado se logra me- 
diante solventes para extraer los plaguicidas de las legumbres y luego realizar pruebas en estos extractos 
para aislar y cuantificar los plaguicidas presentes. Se cree que el proceso de extraction es adecuado 
porque, si se agregan cantidades conocidas de plaguicida a legumbres “limpias” en un ambiente de 
laboratorio, en esencia todos los plaguicidas se pueden eliminar del extracto contaminado de manera 
artificial. 

Los siguientes datos se obtuvieron de un estudio realizado por Willis Wheeler y colegas, 4 que bus- 
caron determinar si el proceso de extraction tambien es eficaz cuando se usa en situaciones mas reales 
donde se aplican plaguicidas a cosechas de legumbres. El Dieldrin (plaguicida de uso comun) marcado 
con carbono-14 (radiactivo) se aplico a rabanos en crecimiento. Catorce dfas despues se empleo el pro¬ 
ceso de extraction y se analizaron los extractos en busca de algun contenido de plaguicida. Un contador 
de centelleo en llquido se utilizo para determinar la cantidad de carbono-14 presente en el extracto y 
tambien la cantidad dejada en la pulpa de la legumbre. Como por lo general la pulpa de la legumbre se 
desecha cuando es analizada en busca de plaguicidas, si una proportion apreciable de plaguicida con- 
tintia en la pulpa podrfa resultar en una subestimacion de la cantidad de plaguicida. Este fue la unica 
fuente de carbono-14 y, por tanto, es probable que la proportion de carbono-14 en la pulpa sea indica- 
tiva de la proportion de plaguicida en la pulpa. La siguiente tabla muestra una parte de los datos que 
los investigadores obtuvieron cuando se emplearon concentraciones bajas, medias y altas del solvente, 
acetonitrilo, en el proceso de extraction. 


3. Fuente: L. S. Richelson, H. W. Wahner, L. J. Melton III, and B. L. Riggs, "Relative Contributions of Aging and 
Estrogen Deficiency to Postmenopausal Bone Loss,” New England Journal of Medicine 311(20) (1984): 1273-1275. 

4. Fuente: Willis B. Wheeler, N. P. Thompson, R. L. Edelstein, R. C. Littel, and R. T. Krause, "Influence of Various 
Solvent-Water Mixtures on the Extraction of Dieldrin and Methomyl Residues from Radishes,” Journal of the Asso¬ 
ciation of Official Analytical Chemists 65(5) (1982): 1112-1117. 
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Porcentaje de carbono-14 en pulpa de legumbre 
Concentration de acetonitrilo 



Baja 

Media 

Alta 


23.37 

20.39 

18.87 


25.13 

20.87 

19.69 


23.78 

20.78 

19.29 


27.74 

20.19 

18.10 


25.30 

20.01 

18.42 


25.21 

20.23 

19.33 


22.12 

20.73 

17.26 


20.96 

19.53 

18.09 


23.11 

18.87 

18.69 


22.57 

18.17 

18.82 


24.59 

23.34 

18.72 


23.70 

22.45 

18.75 

Total 

287.58 

245.56 

224.03 


a i,Hay suficiente evidencia de que el porcentaje medio de carbono-14 restante en la pulpa de la legum¬ 
bre difiere para las diferentes concentraciones de acetonitrilo usadas en el proceso de extraction? 
Fije llmites o use la aplicacion apropiada para determinar el nivel de significancia alcanzado. ^Que 
concluirfa con un nivel de significancia de a = .01? 
b ^Que suposiciones son necesarias para emplear de manera valida el analisis realizado en el inciso a? 
Relatione las suposiciones necesarias con la aplicacion espetifica representada en este ejercicio. 

13.13 Una parte de la investigation descrita en un artlculo cientffico de Yean-Jye Lu 5 comprendla una evalua¬ 
tion de tiempos de maniobra para vehlculos de varios tamanos que daban vuelta a la izquierda en un 
crucero con un carril propio de vuelta a la izquierda pero sin una senal independiente de vuelta en esta 
direction, en el semaforo que controlaba el crucero (una maniobra “desprotegida” de vuelta a la izquier¬ 
da). Se midio el tiempo de maniobra desde el instante en que un vehlculo entraba a los carriles opuestos 
al transito, hasta que pasaba por completo por el crucero. Autos de cuatro cilindros fueron clasificados 
como “pequenos” y los de seis y ocho cilindros como “grandes”. Camiones y autobuses se combinaron 
para formar una tercera categorfa identificada como “camion o autobus”. Otros vehlculos motorizados 
(motocicletas, etc.) se ignoraron en el estudio. Un resumen de los datos, que contiene los tiempos de 
maniobra (en segundos) para vehlculos que intentaban la maniobra de dar vuelta a la izquierda desde 
una position de alto total, aparece en la siguiente tabla. 


Tipo de 
vehlculo 

Tamano 

muestral 

Media 

Desviacion estandar 

Auto pequeno 

45 

4.59 

0.70 

Auto grande 

102 

4.88 

0.64 

Camion o autobus 

18 

6.24 

0.90 


a (.Hay suficiente evidencia para decir que los tiempos medios de maniobra difieren para los tres tipos 
de vehlculo? Establezca llmites para el nivel de significancia alcanzado. 
b Indique la conclusion apropiada para una prueba de nivel a = .05. 

5. Fuente: Yean-Jye Lu, “A Study of Left-Turn Maneuver Time for Signalized Intersections,” ITE Journal 54 (octubre 
de 1984): 42-47. Institute of Transportation Engineers, Washington, D.C., © 1984 I.T.E. Todos los derechos reser- 
vados. 
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13.14 La Comision de Caza y Pesca de la Florida desea comparar las cantidades de residuos de tres sustancias 
quimicas halladas en el tejido cerebral de pelicanos cafes. Muestras aleatorias independientes de diez 
pelicanos aportaron cada una los siguientes resultados (medidos en partes por millon). ^Hay evidencia 
de diferencias importantes entre las cantidades medias de residuos, con un nivel de significancia de 
5%? 


Sustancia quimica 

Estadfstico 

DDE 

DDD DDT 

Media 

.032 

.022 .041 

Desviacion estandar 

.014 

.008 .017 


13.15 Se tomaron muestras de agua en cuatro lugares diferentes en un rio para determinar si la cantidad de 
oxigeno disuelto, que es una medida de la contaminacion del agua, diferia de un lugar a otro. Los luga¬ 
res 1 y 2 se seleccionaron aguas arriba de una planta industrial, uno cerca de la orilla y el otro a media 
corriente; el lugar 3 estaba adyacente a la descarga de aguas industriales de la planta; y el lugar 4 estaba 
ligeramente aguas abajo a media corriente. Se seleccionaron aleatoriamente cinco muestras de agua en 
cada lugar, pero una de ellas, la del lugar 4, se perdio en el laboratorio. Los datos se muestran en la si- 
guiente tabla (cuanto mayor es la contaminacion, menores seran las lecturas de oxigeno disuelto). ^Los 
datos arrojan suficiente evidencia para indicar una diferencia en el contenido medio de oxigeno disuelto 
para los cuatro lugares? Establezca limites para el nivel de significancia alcanzado. 


Lugar Contenido de oxigeno disuelto 


1 

5.9 

6.1 

6.3 

6.1 

6.0 

2 

6.3 

6.6 

6.4 

6.4 

6.5 

3 

4.8 

4.3 

5.0 

4.7 

5.1 

4 

6.0 

6.2 

6.1 

5.8 



13.16 Se realizo un experimento para examinar el efecto de la edad en la frecuencia cardiaca cuando las perso¬ 
nas hacian una cantidad especifica de ejercicio. Diez hombres se seleccionaron aleatoriamente de cuatro 
grupos de edad: 10-19, 20-39, 40-59 y 60-69. Cada persona hizo ejercicio en una caminadora, a un 
ritmo fijo durante 12 minutos y se le registro el aumento en la frecuencia cardiaca (en pulsaciones por 
minuto), es decir, la diferencia en frecuencia antes y despues del ejercicio. Calculos preliminares dieron 
SS total = 1002.975 y SST = 67.475. 
a Construya la tabla ANOVA asociada. 

b ^Los datos aportan suficiente evidencia para indicar diferencias en el aumento medio en la frecuencia 
cardiaca entre los cuatro grupos de edad? Efectue la prueba usando a = .05. 


13.5 Modelo estadfstico para el diseno de un factor 

Igual que antes, denotemos con 1? las variables aleatorias que generan los valores observados 
y t p para i = 1,2,..., k y j = 1,2,..., Los valores 1? corresponden a muestras aleatorias 
independientes de poblaciones normales con E (1?) = /± j y V(Y lJ ) = a 2 , para i = 1,2,..., k v 
j = 1,2,..., tij. Consideremos la muestra aleatoria tomada de la poblacion 1 y escribamos 


Y ij = Mi + e i p 


j= 1 , 2 ,..., n v 
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De modo equivalente. 


sij = Y\j j = 1,2,..., m. 

Como ey es la diferencia entre una variable aleatoria distribuida normalmente y su media, se 
deduce que e 1; esta distribuida normalmente con E(e {j ) = 0 y V(sy) = V(Y^) = cr 2 . Ademas, 
la independencia de L 1; ., para j = 1, 2,..., n v implica que e,- = 1,2,..., iq, son variables 
aleatorias mutuamente independientes. Para cada i = 1,2,...,&, podemos proceder de modo 
analogo para escribir 


Yij fl; Y Sjj , j 1,2,..., 

donde los “terminos de error” e- son variables aleatorias independientes, distribuidas nor¬ 
malmente, con E(e;) = 0 y V(s-) = cr 2 , para i = 1, 2,..., k y j = 1,2,..., n v Los terminos 
de error simplemente representan la diferencia entre las observaciones de cada muestra y las 
medias poblacionales correspondientes. 

Un conjunto mas de consideraciones llevara al modelo clasico para el diseno de un factor. 
Considere las medias ji t , para i = 1, 2,..., k, y escriba 

jx, = fx + t, donde t\ + T 2 + • ■ ■ + t* =0. 

Observe que Y^=i l^i = k/x + Y^=\ T i = k/x y por tanto [x = k 5Z/ = i es s °l° P ro ' 
medio de las k medias poblacionales (los valores jx : ). Por esta razon, /x suele citarse como la 
media total. Como para i = 1, 2,..., k, t t ■ = fx t - /x cuantifica la diferencia entre la media para 
la poblacion i y la media total, r ; normalmente recibe el nombre de efecto de tratamiento (o 
poblacion) i. Por ultimo, presentamos el modelo clasico para el diseno de un factor. 


Modelo estadistico para un diseno de un factor 

Para i = 1, 2,. .., k y j = 1,2 

Yij= fl + T; + Sjj 

donde Y- = la /-esima observacion de la poblacion (tratamiento) i, 
ix = la media general, 

Tj = el efecto no aleatorio del tratamiento i, donde Y^=i T i = 

Sjj = terminos de error aleatorio tales que s- son variables aleatorias indepen¬ 
dientes, distribuidas normalmente, con E (s-) = 0 y V (fi (/ ) = cr 2 . 


La ventaja de este modelo es que resume con gran claridad todas las suposiciones hechas 
en el analisis de los datos obtenidos de un diseno de un factor. Tambien nos da una base 
para presentar un modelo estadistico preciso para el diseno de bloques aleatorizado. (Vea la 
Seccion 13.8.) 

Observe que (vease el Ejercicio 13.19) H 0 : fx^ = fx 2 = • • • = /x k se puede expresar tambien 
como 


H 0 :ri = t 2 = • ■ ■ = t * = 0 
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y que H a : /jl ! =f= /x,- para alguna i i' es equivalente a H a : t ; # 0 para alguna i, 1 < i < k. 
Entonces, la prueba F para igualdad de medias que presentamos en la Seccion 13.3 es la 
prueba de las hipotesis 

Hq : T\ = T 2 = ■ ■ • = Tk = 0 contra H a : r ; i=- 0 para alguna 1 < i < k. 


Ejercicios 

13.17 Con ydenote el promedio de todas las respuestas al tratamiento i. Use el modelo para el diseno de un 
factor para deducir E (b,.) y V(y,.). 

13.18 Consulte el Ejercicio 13.17 y considere Y it — Y para i # i'. 

a Demuestre que E{Y — b,-.) = yLt, — (jiji = t, — t,<. Este resultado implica que y,. — y,-.. es un 
estimador insesgado de la diferencia en los efectos de tratamientos i e i'. 

b Deduzca V(Y L . - Y,,.). 

13.19 Consulte el modelo estadlstico para el diseno de un factor. 

a Demuestre que H 0 : = r 2 = • ■ • = r k = 0 es equivalente a H 0 : = fi 2 = • • • = fji k . 

b Demuestre que H a : r,- # 0 para al menos una i es equivalente a H a : /x, t 4 /x,. para alguna i # 

13.6 Prueba de aditividad de las sumas 
de cuadrados y £(MST) para 
un diseno de un factor (opcional) 

La demostracion de que 


SS total = SST + SSE 

para el diseno de un factor se presenta en esta seccion para beneficio de quienes esten intere- 
sados. Puede omitirse sin perdida de continuidad. 

La demostracion usa resultados elementales en sumatorias que aparecen en los ejercicios 
del Capftulo 1 y la tecnica de sumar y restar Y it dentro de la expresion para el SS total. 
Entonces, 

k tii k tij 

SS total =e E (k ‘/ - ^) 2 =e x>; - y »+ 

i =1 7=1 i=l y=l 

k rij 

= EE [(F b-^.) + m.-F) ]2 

i= 1 7=1 

A rij 

= E E [(K b - i 7 /.) 2 + 2(F l7 - F/OCF,-. - F) + (F;. - F) 2 ]. 

«=i 7=1 
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Sumando primero para j, obtenemos 

k 


SS total = 


i=i 


~ Y >-.) 2 + 2 ( y ‘- - Y ^ Y u - Y -'> + n i ( Y » - Y ) 2 

.7=1 7=1 


donde 


J2 ( Y U - = Y ‘- - n ‘ Y “ = Y - ~ Y - = °- 

7=1 

En consecuencia, el termino medio de la expresion para el SS total es igual a cero. 

Entonces, sumando para i, obtenemos 

k Hi k 

SS total = EB^- k ‘-) 2 + E niiYi.-Y) 2 = SSE + SST. 

i=i j =l /=i 

La demostracion de aditividad de las sumas de cuadrados ANOVA para otros disenos ex- 
perimentales se puede obtener de un modo semejante, aunque el procedimiento es a veces 
tedioso. 

A continuation proseguimos con la deduction del valor esperado del MST para un diseno 
de un factor (incluyendo un diseno completamente aleatorizado). Usando el modelo estadisti- 
co para el diseno de un factor presentado en la Section 13.5 se deduce que 

_ i "■ j n ‘ 1 "> 

Yi. = ~^2 Y ‘j = — + T ‘ + e ' /-* = P- + T i + E/, donde e, = — y~]e,- j. 


7 = 1 


7=1 


n ‘j = 1 


Como las s tj son variables aleatorias independientes con E(s t j) = 0 y V(e ; .) = cr 2 , el Teorema 
5.12 implica (vea el Ejemplo 5.27) que E(sj) = 0 y V(e,) = o" 2 /«/. 

De un modo analogo, Y esta dada por 

Y = yl] EX' = “5Z XX + Ti + ^ + 


1=1 7=1 


i = l 7=1 


donde 


1=1 1=1 7=1 


Como los valores r ; son constantes, t es simplemente una constante; de nuevo, usando el 
Teorema 5.12, obtenemos E(e) = 0 y V(s) = o 2 /n. 

Por tanto, con respecto a los terminos del modelo para el diseno de un factor. 


MST = 


tty) XX r '* - r ) 2 = (j^ry) t Ui(Ti + «'■ - T - e ) 2 
Try) _ t> 2 + (y^ry) P2 2ni( - Ti ~~®) 


i =1 
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Como t y t,., para i = 1,2 .,k, son constantes y E(eij) = E(ei ) = £(e) = 0, se deduce 
que 


£(MST) 


^ -t ) 2 


+ 


^2 n,(e l 



Observe que 


k 


i=l 


k 

e) 2 = («,e 2 - 2n,e,e + «,e 2 ) 

1=1 

= y~] n,s 2 — 2«e 2 + «e 2 = y^ n,s 2 

i=l 1 = 1 


ns 2 . 


ComoEfe,) = 0 y V(e,) = cr 2 /«;, se deduce que £(e 2 ) = tr 2 /«,, paraf = 1, 2,..., k. Del 
mismo modo, E(kr) = a 2 /n y, por tanto. 


E 




n,E (s 2 ) — nE (e 2 ) = kcr 1 — a 1 = (k — l)cr 2 . 

i=i 


Resumiendo, obtenemos 


£(MST) = o- 2 + 



donde t = 


1 * 

= 

n U 


Dada H 0 \ t x = t 2 = ■ ■ ■ = r k = 0, se deduce que f = 0 y, por tanto, li(MST) = cr 2 . 
Entonces, cuando // 0 es verdadera, MST/MSE es la proporcion entre dos estimadores inses- 
gados para cr 2 . Cuando H a : r, i=- 0 para alguna i, 1 < i < & es verdadera, la cantidad 1 /(/c — 1) 
n,(r, — t) 2 es estrictamente positiva y MST es un estimador positivamente sesgado 
para cr 2 . 


13.7 Estimacion en un diseno de un factor 

Los intervalos de confianza para una media de tratamiento y para la diferencia entre un par 
de medias de tratamiento, basados en datos obtenidos en un diseno de un factor (Seccion 
13.3) son por completo analogos a los dados en el Capftulo 8. La unica diferencia entre 
los intervalos del Capftulo 8 y los que siguen es que los intervalos asociados con el diseno 
de un factor usan el MSE (el estimador agrupado basado en todas las k muestras) para 
estimar la(s) varianza(s) poblacional(es) cr 2 . El intervalo de confianza para la media de 
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tratamiento i o la diferencia entre las medias para tratamientos i e i' son, respectivamente, 
como sigue: 


Y i. 




(Yi. -Y r .)±t a/2 S - + —, 


l l ,l l' 


donde 


s =Vsi =VMSE = 


SSE 


n i + «2 + ■ ■ ■ + rik — k 


y t a i 2 esta basada en (n — k) grados de libertad. 


Los intervalos de confianza que acabamos de expresar son apropiados para una media de tra¬ 
tamiento o una comparacion de un par de medias seleccionadas antes de la observation de los 
datos. Es probable que estos intervalos sean mas cortos que los intervalos correspondientes 
del Capftulo 8 porque el valor de t an esta basado en un mayor numero de grados de libertad 
(n — k en lugar de n ; — 1 o n j + n v — 2, respectivamente). Los coeficientes de confianza 
expresados son apropiados para una media o diferencia en dos medias identificadas antes de 
observar los datos reales. Si observaramos los datos y siempre compararamos las poblaciones 
que produjeron la maxima y minima medias muestrales, esperarfamos que la diferencia entre 
estas medias muestrales fuera mas grande que para un par de medias especificado como de 
interes antes de observar los datos. 


EJEMPLO 13.3 Encuentre un intervalo de confianza de 95% para la calificacion media para la tecnica de en- 
senanza 1, Ejemplo 13.2. 


Solucion El intervalo de confianza de 95% para la calificacion media es 

S 

Y l . ± t. 025 


donde t (m esta determinada por n — k = 19 grados de libertad o 

V63 

75.67 ±(2.093)^— o 75.67 ±6.78. 

V6 

Observe que si hubieramos analizado solo los datos para la tecnica de ensenanza 1, el valor 
t 025 hubiera estado basado en solo n 1 — 1 = 5 grados de libertad, el numero de grados de 
libertad asociado con s^. ■ 


EJ EMPLO 13.4 Encuentre un intervalo de confianza de 95% para la diferencia en la calificacion media para 
las tecnicas de ensenanza 1 y 4, Ejemplo 13.2. 
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Solucion El intervalo de confianza de 95% es 

(Ti. - Yf) ± (2.093) (7.94)71/6 + 1/4 o -12.08 ± 10.73. 

En consecuencia, el intervalo de confianza de 95% para (/jl 1 — /r 4 ) es (—22.81, —1.35). En 
el nivel de confianza de 95% concluimos que /r 4 > /jl 1 por al menos 1.35 pero no mas de 
22.81. ■ 


Ejercicios 


13.20 


13.21 


13.22 


13.23 


13.24 


Consulte los Ejemplos 13.2 y 13.3. 

a Use la parte de los datos de la Tabla 13.2 que se refiere solo a la tecnica de ensenanza 1 y el metodo de 
la Section 8.8 para formar un intervalo de confianza de 95% para la calificacion media de estudiantes 
instruidos usando la tecnica 1. 

b ^Como se compara la longitud del intervalo de confianza de 95% hallada en el inciso a contra la 
longitud del intervalo de confianza de 95% obtenida en el Ejemplo 13.3? 
c ^Cual es la principal razon para que el intervalo hallado en el inciso a sea mas largo que el intervalo 
dado en el Ejemplo 13.3? 

Consulte los Ejemplos 13.2 y 13.4. 

a Use la parte de los datos de la Tabla 13.2 que se refiere solo a las tecnicas de ensenanza 1 y 4, asf 
como el metodo de la Section 8.8, para formar un intervalo de confianza de 95% para la diferencia 
en la calificacion media para estudiantes instruidos usando las tecnicas 1 y 4. 
b ^Como se compara la longitud del intervalo de confianza de 95% hallada en el inciso a con la longi¬ 
tud del intervalo de confianza de 95% obtenida en el Ejemplo 13.4? 
c ^Cual es la principal razon para que el intervalo hallado en el inciso a sea mas largo que el intervalo 
dado en el Ejemplo 13.4? 

a Con base en sus respuestas a los Ejercicios 13.20 y 13.21, asf como en los comentarios al final de esta 
section, ^como esperarfa usted que se comparen los intervalos de confianza calculados usando los 
resultados de esta section contra los intervalos relacionados que hacen uso de los datos de solo una 
o dos de las muestras obtenidas en el diseno de un factor? ^Por que? 
b Consulte el inciso a. ^Es posible que un intervalo de confianza de 95% para la media de una po- 
blacion, basado solo en la muestra tomada de dicha poblacion, sea mas corto que el intervalo de 
confianza de 95% para la misma media poblacional que se obtendrfa usando el procedimiento de esta 
section? ^Como? 

Consulte el Ejercicio 13.7. 

a Construya un intervalo de confianza de 95% para la cantidad media de aguas residuales contaminan- 
tes por galon para la planta A. Si el lfmite para la cantidad media de aguas residuales contaminantes 
es 1.5 libras/galon, ^se concluirfa que la planta A rebasa este lfmite? ^Por que? 
b De un intervalo de confianza de 95% para la diferencia en la media de aguas residuales contaminan¬ 
tes por galon para las plantas A y D. ^Este intervalo indica que la media de aguas residuales por galon 
difiere para estas dos plantas? ^Por que? 

Consulte el Ejercicio 13.8. Construya un intervalo de confianza de 98% para la diferencia en la media 
de salarios iniciales para profesores auxiliares en instituciones publicas y privadas/independientes que 
otorgan doctorados. 
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13.25 Consulte el Ejercicio 13.11. Como se hizo notar en la description del experimento, los grupos con 
ooforectomla y premenopausico de mujeres tenlan aproximadamente la misma edad, pero las del grupo 
de ooforectomla sufrlan de deficiencia de estrogeno. Forme un intervalo de confianza de 95% para la 
diferencia en densidades oseas medias para estos dos grupos de mujeres. ^Concluirla que las densidades 
oseas medias para las mujeres con ooforectomla y premenopausicas eran considerablemente diferentes? 
^Por que? 

13.26 Consulte el Ejercicio 13.9. Con /r A y /jl b denote las resistencias medias de especlmenes de concreto 
preparados con la mezcla A y la mezcla B, respectivamente. 

a Determine un intervalo de confianza de 90% para /jl a . 
b Determine un intervalo de confianza de 95% para (/u, A — /r B ). 

13.27 Consulte el Ejercicio 13.10. Con /x A y /u, B , respectivamente, denote las calificaciones medias al final del se- 
mestre para las poblaciones de estudiantes hostiles en exceso que fueron tratados durante todo ese 
semestre por los metodos A y B, respectivamente. Encuentre un intervalo de confianza de 95% para 

a /v 
b /r B . 

c (P-a — P-b)- 

13.28 Consulte el Ejercicio 13.12. 

a Construya un intervalo de confianza de 95%, para el porcentaje medio de restos de carbono-14 en la 
pulpa de legumbre cuando se usa un nivel bajo de acetonitrilo. 
b De un intervalo de confianza de 90%, para la diferencia en porcentajes medios de carbono-14 que 
quedan en la pulpa de legumbres, para niveles bajo y medio de acetonitrilo. 

13.29 Consulte el Ejercicio 13.13. 

a Proponga un intervalo de confianza de 95% para el tiempo medio de maniobra para dar vuelta a la 
izquierda para autobuses y camiones. 

b Estime la diferencia en los tiempos medios de maniobra para autos pequenos y grandes, con un inter¬ 
valo de confianza de 95%. 

c El reporte del estudio hecho por Lu comprendla vehlculos que pasaban por el crucero de Guadalupe 
Avenue y la Calle 38, en Austin, Texas. ^Piensa usted que los resultados de los incisos a y b serfan 
validos para un crucero “desprotegido” en su ciudad? <,Por que si o por que no? 

13.30 Se ha hecho la hipotesis de que tratamientos (despues de moldeo) de un plastico empleado en lentes 
opticos mejora las cualidades de resistencia al desgaste. Se han de probar cuatro tratamientos diferentes. 
Para determinar si existe alguna diferencia entre tratamientos se hicieron 28 moldes de una sola formula 
del plastico y se asignaron aleatoriamente 7 a cada uno de los tratamientos. La resistencia al desgaste se 
determino al medir el aumento de “neblina” despues de 200 ciclos de abrasion (una mejor resistencia al 
desgaste esta indicada por menores aumentos). Los datos recolectados se indican en la siguiente tabla. 


Tratamiento 

A 

B 

C 

D 

9.16 

11.95 

11.47 

11.35 

13.29 

15.15 

9.54 

8.73 

12.07 

14.75 

11.26 

10.00 

11.97 

14.79 

13.66 

9.75 

13.31 

15.48 

11.18 

11.71 

12.32 

13.47 

15.03 

12.45 

11.78 

13.06 

14.86 

12.38 
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13.31 


13.32 

13.33 

13.34 

13.35 


a i,Hay evidencia de una diferencia en resistencia media al desgaste entre los cuatro tratamientos? Use 
a = .05. 

b Estime la diferencia media en el aumento de neblina entre los tratamientos B y C usando un intervalo 
de confianza de 99%. 

c Encuentre un intervalo de confianza de 90% para la resistencia media al desgaste para lentes que 
reciben el tratamiento A. 

Con la actual crisis energetica, investigadores de las principales companfas petroleras estan tratando 
de hallar fuentes alternativas de petroleo. Se sabe que algunos tipos de pizarra bituminosa contienen 
pequenas cantidades de petroleo que es factible (mas no economico) extraer. Se han creado cuatro me- 
todos para extraer petroleo de esta pizarra y el gobierno ha decidido que deben realizarse experimentos 
para determinar si los metodos difieren considerablemente en la cantidad promedio de petroleo que 
pueda extraerse de la pizarra con cada uno de ellos. Se sabe que el metodo 4 es el mas costoso de ins- 
trumentar y que el metodo 1 es el menos costoso, de modo que las inferencias acerca de las diferencias 
en el rendimiento de estos dos metodos son de particular interes. Dieciseis trozos de pizarra (del mismo 
tamano) se sometieron aleatoriamente a los cuatro metodos, con los resultados que se muestran en la 
siguiente tabla (las unidades son en litros por metro cubico). Todas las inferencias han de hacerse con 
a = .05. 


Metodo 1 

Metodo 2 

Metodo 3 

Metodo 4 

3 

2 

5 

5 

2 

2 

2 

2 

1 

4 

5 

4 

2 

4 

1 

5 


a Suponiendo que las 16 unidades experimentales fueran lo mas semejantes posible, realice el ANOVA 
apropiado para determinar si hay alguna diferencia importante entre las cantidades medias extrafdas 
por los cuatro metodos. Use a = .05. 

b Construya un intervalo de confianza de 95% para la diferencia en las cantidades medias extrafdas por 
los dos metodos de particular interes. Interprete el resultado. 

Consulte el Ejercicio 13.14. Construya un intervalo de confianza de 95% para la cantidad media de 
residuo de DDT. 

Consulte el Ejercicio 13.15. Compare el contenido medio de oxfgeno disuelto a media corriente arriba 
de la planta contra el contenido medio adyacente a la planta (lugar 2 contra lugar 3). Use un intervalo de 
confianza de 95%. 

Consulte el Ejercicio 13.15. Compare el contenido medio de oxfgeno disuelto para los dos lugares aguas 
arriba de la planta, contra el contenido medio ligeramente aguas abajo de la planta, hallando un intervalo 
de confianza de 95% para (1/2) (/u,j + /x 2 ) — /r 4 . 

Consulte el Ejercicio 13.16. El promedio de aumento en el ritmo cardiaco para las diez personas de cada 
una de las categorfas de edad fue 


Edad 

Tamano 

muestral 

Promedio de aumento 

en ritmo cardiaco 

10-19 

10 

30.9 

20-39 

10 

27.5 

40-59 

10 

29.5 

60-69 

10 

28.2 


a Encuentre un intervalo de confianza de 90% para la diferencia en el aumento medio en la frecuencia 
cardiaca para los grupos de edades de 10-19 y 60-69. 

b Encuentre un intervalo de confianza de 90% para el aumento medio en la frecuencia cardiaca para el 
grupo de edad de 20-39 anos. 
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El analisis de varianza 


13.8 Modelo estadfstico para el diseno 
de bloques aleatorizado 

El metodo para construir un diseno de bloques aleatorizado se presento en la Seccion 12.4. 
Como ya indicamos en la Definicion 12.6, el diseno de bloques aleatorizado se emplea para 
comparar k tratamientos usando b bloques. Los bloques se seleccionan de modo que, con 
optimismo, las unidades experimentales dentro de cada bloque sean homogeneas en esencia. 
Los tratamientos se asignan de manera aleatoria a las unidades experimentales de cada bloque, 
en forma tal que cada tratamiento aparece exactamente una vez en cada uno de los b bloques. 
Entonces, el numero total de observaciones obtenidas en un diseno de bloques aleatorizado es 
n = bk. En el analisis de un diseno de bloques aleatorizado esta implicita la presencia de dos 
variables cualitativas independientes, “bloques” y “tratamientos”. En esta seccion presenta- 
mos un modelo estadfstico formal para el diseno de bloques aleatorizado. 


Modelo estadfstico para un diseno de bloques aleatorizado 

Para i = 1, 2,..., k yj = 1, 2,..., b, 

Yij = /J, + Tj + fij + Eij 


donde 


U 



observacion del tratamiento ; en el bloque j, 
la media general, 

efecto no aleatorio del tratamiento i, donde 5H;=i T ' = 0, 

el efecto no aleatorio del bloque j, donde Y^j=\ Pi = 0- 
terminos de error aleatorios tales que e- son variables aleatorias inde¬ 
pendientes, distribuidas normalmente, con E (e y ) = 0 y V (sf = a 2 . 


Observe que se supone que /jl , r,, r 2 , ..., T k y /3 ,, /3 2 ,, p h son constantes que se suponen 
desconocidas. Este modelo difiere del de diseno completamente aleatorizado (un tipo especf- 
fico de diseno de un factor) solo en que contiene parametros asociados con los diferentes blo¬ 
ques. Ya que se supone que los efectos de los bloques son fijos pero desconocidos, este modelo 
por lo general se conoce como modelo de bloques de efectos fijos. Un modelo de efectos de 
bloque aleatorios, otro modelo para el diseno de bloques aleatorizado en el que se supone que 
las (i son variables aleatorias, se considera en los ejercicios complementarios. Nuestro desa- 
rrollo formal en el cuerpo de este texto esta restringido al modelo de bloque de efectos fijos. 

El modelo estadfstico que acabamos de presentar resume de manera muy clara todas las su- 
posiciones hechas en el analisis de datos en un diseno de bloques aleatorizado con efectos de 
bloque fijos. Consideremos la observacion Y t - hecha en el tratamiento i en el bloque j. Observe 
que las suposiciones del modelo implican que EiYf = yu, + r ; + /3, y V(Yf = a 2 para i = 1, 
2,.. ., k y j = 1, 2, ..., b. Consideremos las observaciones hechas en el tratamiento i y advir- 
tamos que dos observaciones que reciben el tratamiento i tienen medias que difieren solo por 
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la diferencia de los efectos de bloque. Por ejemplo, 

E (Til) - E (Y i2 ) = fl+Ti + Pi - (jU- + Ti + p 2 ) = Pi ~ P 2 . 

Del mismo modo, dos observaciones que se tomen del mismo bloque tienen medias que difie- 
ren solo por la diferencia de los efectos de tratamiento. Esto es, si i A 

E ( Ytj ) - E ( Y rj ) = fl + Ti + Pj ~ (fl + Ti, + Pj ) = Ti ~ Tf. 

Observaciones que se tomen en diferentes tratamientos y en diferentes bloques tienen medias 
que discrepan por la diferencia en los efectos de tratamiento mas la diferencia en los efectos 
de bloque porque, si i =f= i' y j =f= j', 

E ( Yfj) - E ( Y Vj ,) = fl+T, + Pj ~ (fl + Ti' + Pj') = (Ti - Ti') + (Pj - Pj'). 

En la siguiente seccion continuamos con un analisis de los datos obtenidos de un diseno de 
bloques aleatorizado. 


Ejercicios 


13.36 Exprese las suposiciones que sirven de base al ANOVA para un diseno de bloques aleatorizado con 
bloques de efectos fijos. 

13.37 De acuerdo con el modelo para el diseno de bloques aleatorizado dado en esta seccion, la respuesta 
esperada cuando el tratamiento i se aplica en el bloque j es E(Y tj ) = /x + r t + ft-, para i = 1, 2,..., k y 
j=\,2,...,b. 

a Use el modelo dado en esta seccion para calcular el promedio de las n = bk respuestas esperadas 
asociadas con todos los bloques y tratamientos. 

b De una interpretacion para el parametro /r que aparece en el modelo para el diseno de bloques alea¬ 
torizado. 

13.38 Con Yi, denotando el promedio de todas las respuestas al tratamiento i. Use el modelo para el diseno de 
bloques aleatorizado para deducirE (E;.) y V (E;.). ^Y jt es un estimador insesgado para la respuesta 
media al tratamiento r? ^,Por que si o por que no? 

13.39 Consulte el Ejercicio 13.38 y considere J 7 ,. — E,, para i A i'. 

a Demuestre que E (E,. — E,;.) = 77 — 7p. Este resultado implica que E,. — E,-. es un estimador 
insesgado de la diferencia en los efectos de tratamiento i e i'. 

b Deduzca V (7,. - 7,.). 

13.40 Consulte el modelo para el diseno de bloques aleatorizado y con Y.j denote el promedio de todas las 
respuestas del bloque j. 

a Deduzca£(E. / ) y V(E. ; ), 

b Demuestre que Y,j — Y,j' es un estimador insesgado para Pj - Pj. la diferencia en los efectos de los 
bloques i y /. 

c Deduzca V (Y.j — Y.j /). 
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13.9 El analisis de varianza para el diseno 
de bloques aleatorizado 

El ANOVA para un diseno de bloques aleatorizado tiene una forma muy semejante al de un 
diseno completamente aleatorizado (que es un caso especial del diseno de un factor). En el di¬ 
seno de bloques aleatorizado, la suma total de cuadrados, SS total, se divide en tres partes: la 
suma de cuadrados por bloques, tratamientos y error. 

Denote el total y promedio de todas las observaciones del bloque j como Y.j y Y.j, respec- 
tivamente. Del mismo modo, Y,. y Y )■. representan el total y el promedio de todas las obser¬ 
vaciones que reciben el tratamiento i. De nuevo, los “puntos” en los subindices indican cual 
indice es el “sumado” para calcular los totales y el “promediado” para calcular los promedios. 
Entonces, para un diseno de bloques aleatorizado que contenga b bloques y k tratamientos 
tenemos las siguientes sumas de cuadrados: 


SS total = J2 X>; - y ) 2 = E £ Y u ~ CM 
;=i 7=1 1=1 7=1 

= SSB + SST + SSE, donde 

b b y2 

SSB = k Y^(X-j - Y) 2 = £ — - CM ’ 


j =1 
k 


7 = 1 
k y2 


SST = b - Y) 2 = J2- CM, 

i =1 i = 1 " 

SSE = SS total - SSB - SST. 


En las formulas anteriores, 


J b k 

Y = (promedio de todas las n = bk observaciones) = — 

k j- t i=i 


y 


CM 


(total de todas las observaciones) 2 
n 


1 

bk 



La tabla ANOVA para el diseno de bloques aleatorizado se presenta en la Tabla 13.5. Los 
grados de libertad asociados con cada suma de cuadrados se muestran en la segunda colum- 
na. Los cuadrados medios se calculan dividiendo la suma de cuadrados entre sus grados de 
libertad respectivos. 

Para probar la hipotesis nula de que no hay diferencia en las medias de tratamiento usamos 
el estadistico F 
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Tabla 13.5 Tabla ANOVA para un diseno de bloques 
aleatorizado 


Fuente 

Grados de libertad 

ss 

MS 

Bloques 

b -1 

SSB 

SSB 

b - 1 

Tratamientos k — 1 

SST 

SST 

k - 1 

Error 

n — b — k + 1 

SSE 

MSE 

Total 

n — 1 

SS total 



MST 

MSE 


y rechazamos la hipotesis nula si F > F a , con base cn v t = (k — 1) y v 2 = (n — b — k + 1) 
grados de libertad en numerador y denominador, respectivamente. 

Como ya dijimos en la Seccion 12 . 4 , es posible usar bloqueo para controlar una fuente ex- 
trana de variacion (la variacion entre bloques). Ademas, con bloqueo tenemos la oportunidad 
de ver si existe evidencia para indicar una diferencia en la respuesta media para bloques. Dada 
la hipotesis nula de que no hay diferencia en la respuesta media para bloques (esto es, /3 ; = 0, 
para j = 1 , 2 , ..., b), el cuadrado medio para bloques (MSB) da un estimador insesgado para 
cr 2 con base en (b — 1) grados de libertad. En donde existan diferencias reales entre las medias 
de bloque, la MSB tendera a estar influida en comparacion con el MSE y 

MSB 

F = - 

MSE 


da un estadistico de prueba. A1 igual que en la prueba para tratamientos, la region de rechazo 
para la prueba es 


F>F„ 


donde F tiene Vj = b — ly v 2 = n — b — k + 1 grados de libertad en numerador y denomi¬ 
nador, respectivamente. 


EJEMPLO 13.5 Un experimento de respuesta a estimulo, que comprende tres tratamientos, se presento en un 
diseno de bloques aleatorizado usando cuatro sujetos (personas). La respuesta fue el tiempo 
hasta la reaccion, medido en segundos. Los datos se ven en bloques en la Figura 13.2. El 
numero de tratamiento esta circulado y se muestra arriba de cada observation. ^Los datos 
presentan suficiente evidencia para indicar una diferencia en las respuestas medias para es- 
timulos (tratamientos)? <,Y en las personas? Use a = .05 para cada prueba y de los valores p 
asociados. 
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FIGURA 13.2 
Diseno de bloques 
aleatorizado para el 
Ejemplo 13.5 


Solucion 


Personas 


1 


2 3 4 


© 

1.7 


2.1 


© 

0.1 


© 

2.2 

® 


© 


© 


© 

2.3 


1.5 


2.3 


0.6 

© 


© 


® 


© 

3.4 


2.6 


0.8 


1.6 


Tabla 13.6 Tabla ANOVA para el Ejemplo 13.5 


Fuente 

Grados de 
libertad 

SS 

MS 

F 

Bloques 

3 

3.48 

1.160 

15.47 

Tratamientos 2 

5.48 

2.740 

36.53 

Error 

6 

.45 

.075 


Total 

11 

9.41 




Los valores observados de las sumas de cuadrados para el ANOVA se muestran conjuntamen- 
te en la Tabla 13.6 y en forma individual como sigue: 


CM 

SS total 


SSB 

SST 

SSE 


(total) 2 (21.2) 2 

--- = --- = 37.45, 

n 12 

4 3 4 3 

E Yfiyv ~ ^ )2 = E E >’5 - CM = 46 - 86 - 37 - 45 = 9 - 4l > 

7=1 i=l 7 = 1 »=1 

4 y 2 

E — - CM = 40.93 - 37.45 = 3.48, 

7 = 1 3 

3 y2 

'y — - CM = 42.93 - 37.45 = 5.48, 

U 4 

SS total - SSB - SST = 9.41 - 3.48 - 5.48 = .45. 


Usamos la relacion entre MST y MSE para probar una hipotesis de que no hay diferencia 
en la respuesta media a los tratamientos. Asi, el valor calculado de F es 


MST 

MSE 


2.74 

7075 


36.53. 


El valor crftico del estadfstico F(a = .05) para v, = 2 y v 2 = 6 grados de libertad es 
F 05 = 5.14. Como el valor calculado de F excede al valor crftico, hay suficiente evidencia en 
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13.41 


13.42 


el nivel a = .05 para rechazar la hipotesis nula y concluir que existen diferencias reales entre 
las respuestas esperadas para los tres estfmulos. El correspondiente valor p = P(F > 36.53) 
que, con base en la Tabla 7, Apendice 3, es tal que valor p < .005. La aplicacion F-Ratio 
Probabilities and Quantiles da el valor p = P(F > 36.53) = .00044 exacto. 

Es posible realizar una prueba similar para la hipotesis nula de que no existe diferencia en 
la respuesta media para personas. El rechazo de esta hipotesis implicana que hay diferencias 
significativas entre personas y que es deseable el bloque. El valor calculado de F con base en 
Vj = 3 y v 2 = 6 grados de libertad es 


MSB 1.16 

F = - = - = 15.47. 

MSE .075 

Como este valor de Texcede al correspondiente valor crftico tabulado, F os = 4.76, rechazamos 
la hipotesis nula y concluimos que existe una diferencia real en las respuestas medias entre los 
cuatro grupos de personas. La aplicacion indica que el valor p asociado = P(F > 15.47) = 
.00314. Con base en la Tabla 7, Apendice 3, habriamos concluido solo que el valor 
p < .005. A pesar de todo, concluimos que el bloqueo por personas fue benefico. 


Ejercicios 

En el Ejercicio 12.10 se realizo un analisis de observaciones pareadas para comparar las diferencias 
en tiempo medio de CPU para ejecutar programas de comparacion en dos computadoras. Los datos se 
reproducen en la siguiente tabla. 


Programa de comparacion 

Computadora 

1 

2 3 4 

5 

6 

1 

1.12 

1.73 1.04 1.86 

1.47 

2.10 

2 

1.15 

1.72 1.10 1.87 

1.46 

2.15 


a Trate los seis programas como seis bloques y pruebe para una diferencia entre los tiempos medios de 
CPU para las dos computadoras usando un analisis de bloques aleatorizado. Use a = .05. ^Como se 
compara su decision con la tomada en el Ejercicio 12.10(a)? 
b Proporcione llmites para el valor p asociado. ^Como se compara su respuesta con su respuesta al 
Ejercicio 12.10(b)? 

c Ejercicio Applet Use la aplicacion F-Ratio Probabilities and Quantiles para hallar el valor p exacto. 
d ^Como se compara el valor del MSE con el valor para s 2 D que usted empleo en su solution del 
Ejercicio 12.10? 

La siguiente tabla presenta datos de production que se relacionan con la resistencia a las manchas, para 
tres materiales (M l , M 2 y M 3 ) tratados con cuatro productos qunnicos en un diseno de bloques aleatori¬ 
zado. (Un valor bajo indica buena resistencia a las manchas.) 
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Producto 

Material 



qufmico 

Mi 

m 2 

m 3 

Total 

A 

5 

9 

7 

21 

B 

3 

8 

4 

15 

C 

8 

13 

9 

30 

D 

4 

6 

8 

18 

Total 

20 

36 

28 

84 

EE,t5 

= 674 

1 

12 

(EE, 

y,-,) 2 = 588 


a i,Hay evidencia de diferencias en la resistencia media entre los cuatro productos qufmicos? De lfmi- 
tes para el valor p. 

b r,Que se concluirfa en el nivel de significancia a = .05? 

13.43 Consulte el Ejercicio 13.42. ^Por que se utilizo un diseno de bloques aleatorizado para comparar los 
productos qufmicos? 

13.44 ^E1 promedio de los costos de los seguros de automoviles difieren para diferentes companfas de seguros? 
Otras variables que afectan los costos de los seguros son la ubicacion geografica, edades de los conduc- 
tores y el tipo de cobertura. Las siguientes son estimaciones (en dolares) del costo de polizas de 6 meses 
para cobertura de responsabilidad basica para un solo hombre que ha tenido licencia de manejo durante 
6-8 anos, no ha cometido infracciones ni ha tenido accidentes y viaja en auto entre 12 600 y 15 000 
millas por ano. 6 


Companfa de seguros 


Ubicacion 

21st 

Century 

Allstate 

AAA 

Fireman’s 

Fund 

State 

Farm 

Riverside 

736 

745 

668 

1065 

1202 

San Bernardino 

836 

725 

618 

869 

1172 

Hollywood 

1492 

1384 

1214 

1502 

1682 

Long Beach 

996 

884 

802 

1571 

1272 


a ^Que tipo de diseno se utilizo en la recoleccion de esta informacion? 

b (.Hay suficiente evidencia para indicar que el promedio de primas de seguro difiere de una companfa 
a otra? 

c (,Hay suficiente evidencia para indicar que las primas de seguro difieren de una ubicacion a otra? 
d Ejercicio Applet Use la aplicacion F-Ratio Probabilities and Quantiles para hallar los valores p 
asociados con las pruebas en los incisos bye. 

13.45 Se realizo un experimento para determinar el efecto de tres metodos de preparacion del suelo en el 
crecimiento de primer ano de arbolitos de pino ayacahuite. Se seleccionaron cuatro lugares (terrenos de 
bosques del estado) y cada lugar se dividio en tres terrenos. Debido a que era probable que la fertilidad 
del suelo dentro de un terreno fuera mas homogenea que entre lugares, se empleo un diseno de bloques 
aleatorizado, usando lotes como bloques. Los metodos de preparacion del suelo fueron A (sin prepara¬ 
cion), B (fertilization ligera) y C (quema). Cada preparacion del suelo se aplico a un lote dentro de cada 
lugar. En cada lote se planto el mismo numero de arbolitos y la observation registrada fue el promedio 
de crecimiento del primer ano (en centfmetros) de la semilla en cada lote. Estas observaciones se repro- 
ducen en la siguiente tabla. 


6. Fuente: “2003 Auto Insurance,” California Department of Insurance, http:cdinswww.insurance.ca.gov/pls/wu- 
survey-auto/apsw-get-prem$auto-mc.querylist, 23 de abril de 2004. 
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Preparation 
del suelo 


Lugar 


1 

2 

3 

4 

A 

11 

13 

16 

10 

B 

15 

17 

20 

12 

C 

10 

15 

13 

10 


a Realice un ANOVA. ^Los datos arrojan suficiente evidencia para indicar diferencias en el crecimien- 
to medio para las tres preparaciones del suelo? 
b i,Hay evidencia para indicar diferencias en el crecimiento medio para los cuatro lugares? 

13.46 A. E. Dudeck y C. H. Peacock informan sobre un experimento realizado para evaluar el rendimiento de 
varios cespedes de estacion fria, para ver el efecto de siembra excesiva de greens de golf en inviemo 
en el norte de la Florida. Una de las variables de interes fue la distancia que una pelota de golf rodarfa en 
un green despues de hacerla bajar por una rampa (que se usa para inducir una velocidad inicial constante 
a la pelota). Debido a que la distancia que la pelota rodarfa estaba influida por la pendiente del green y la 
direccion en la que se podaba el cesped, el experimento se realizo en un diseno de bloques aleatorizado. 
Los bloques se determinaron para que las pendientes de los tramos individuales fueran constantes dentro 
de bloques (se empleo un teodolito para asegurar la precision) y todos los tramos fueron podados en la 
misma direccion y a la misma altura para eliminar los efectos de la poda. El cesped base era “Tiftgreen 
Bermuda” en estado de casi hibernation. Se usaron el mismo metodo de siembra y rapidez de aplicacion 
para todos los cespedes que estan representados en la siguiente tabla de datos. Las medidas son distan¬ 
ces promedio (en metros) desde la base de la rampa hasta los puntos de parada de cinco pelotas que se 
hicieron bajar de la rampa y subir por la pendiente de cada tramo. Entre las variedades de cesped usados 
en el estudio habfa A (ballico Pennfine), B (ballico Dasher), C (ballico real), D (supremo Marvelgreen) 
y E (ballico Barry). Las variedades de cesped se plantaron dentro de bloques y dieron como resultado 
las medidas que se ilustran. 7 





Variedad 



Total 

Bloque 

A 

B 

C 

D 

E 

1 

2.764 

2.568 

2.506 

2.612 

2.238 

12.688 

2 

3.043 

2.977 

2.533 

2.675 

2.616 

13.844 

3 

2.600 

2.183 

2.334 

2.164 

2.127 

11.408 

4 

3.049 

3.028 

2.895 

2.724 

2.697 

14.393 

Total 

11.456 

10.756 

10.268 

10.175 

9.678 

52.333 


a Realice el ANOVA apropiado para probar que hay suficiente evidencia para indicar que la distancia 
media rodada por la pelota difiere para las cinco variedades de cesped. Indique lfmites para el nivel 
de significancia alcanzado. (,Que concluirfa usted con un nivel de significancia de a = .01? 
b (.Hay evidencia de una diferencia importante entre los bloques usados en el experimento? Pruebe 
usando a = .05. 

13.47 Consulte el Ejercicio 13.31. Suponga que ahora averiguamos que las 16 unidades experimentales se 
obtuvieron de la manera siguiente. Se tomo una muestra de cada uno de cuatro lugares, cada muestra 
individual se dividio en cuatro partes y luego cada metodo se aplico a exactamente una parte de cada 
lugar (con la aleatorizacion apropiada). Los datos ahora se presentan de modo mas correcto en la forma 
mostrada en la siguiente tabla. ^Esta information sugiere un metodo mas apropiado de analisis que 


7. Fuente: A. E. Dudeck y C. H. Peacock, “Effects of Several Overseeded Ryegrasses on Turf Quality, Traffic Tole¬ 
rance and Ball Roll." Proceedings of the Fourth International Tutfgrass Research Conference, R. W. Sheard, ed., pp. 
75-81. Ontario Agricultural College, University of Guelph, Guelph, Ontario, and the International Turfgrass Society, 
1981. 
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el usado en el Ejercicio 13.31? Si es asf, realice el nuevo analisis y conteste la pregunta del Ejercicio 
13.31(a). ^,Es util esta nueva informacion? 


Lugar 

Metodo 1 

Metodo 2 

Metodo 3 

Metodo 4 

1 

3 

2 

5 

5 

11 

2 

2 

2 

2 

111 

1 

4 

5 

4 

IV 

2 

4 

1 

5 


13.48 Suponga que a un diseno de bloques aleatorizado con b bloques y k tratamientos se le mide dos veces el 
tratamiento en cada bloque. Indique como harfa usted los calculos de un ANOVA. 

13.49 Se realiza una evaluation de adherentes de difusion de componentes de aleacion de circonio. El objetivo 
principal es determinar cual de tres elementos: nlquel, hierro o cobre, es el mejor agente de adherencia. 
Una serie de componentes de aleacion de circonio se pegan usando cada uno de los posibles agentes de 
adherencia. Debido a una considerable variation en los componentes maquinados de diferentes lingotes, 
se emplea un diseno de bloques aleatorizado que bloquea los lingotes. Dos componentes de cada lingote 
se pegan usando cada uno de los tres agentes y se mide la presion (en unidades de 1000 libras por pul- 
gada cuadrada) necesaria para separar los componentes pegados. Se obtienen los datos que se muestran 
en la tabla siguiente. ^Hay evidencia de una diferencia en las presiones medias necesarias para separar 
los componentes entre los tres agentes adherentes? Use a = .05. 


Agente adherente 

Lingote 

Nfquel 

Hierro 

Cobre 

1 

67.0 

71.9 

72.2 

2 

67.5 

68.8 

66.4 

3 

76.0 

82.6 

74.5 

4 

72.7 

78.1 

67.3 

5 

73.1 

74.2 

73.2 

6 

65.8 

70.8 

68.7 

7 

75.6 

84.9 

69.0 


13.50 De vez en cuando, una sucursal de una empresa debe hacer envfos a otra sucursal en otro estado. Tres 
servicios de entrega de paqueterfa operan entre las dos ciudades donde estan ubicadas las oficinas sucur- 
sales. Debido a que las estructuras de precios de los tres servicios de entrega son muy semejantes, la em¬ 
presa desea comparar los tiempos de entrega. La empresa piensa hacer varios tipos de envios diferentes a 
su sucursal. Para comparar los servicios de paqueterfa, la empresa remite cada envfo por triplicado, uno 
con cada servicio de paqueterfa. Los resultados citados en la siguiente tabla son los tiempos de entrega 
en horas. 


Envfo 


Paqueterfa 

I 

11 

111 

1 

15.2 

16.9 

17.1 

2 

14.3 

16.4 

16.1 

3 

14.7 

15.9 

15.7 

4 

15.1 

16.7 

17.0 

5 

14.0 

15.6 

15.5 


a f,Hay evidencia de una diferencia en los tiempos medios de entrega entre los tres servicios de paque¬ 
terfa? Proporcione lfmites para el nivel de significancia alcanzado. 
b f,Por que se realizo el experimento usando un diseno de bloques aleatorizado? 
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* 13.51 Consulte el modelo de diseno de bloques aleatorizado presentado en la Seccion 13.8. 
a Deduzca £(MST). 
b Deduzca £(MSB). 
c Deduzca Zs(MSE). 

Observe que estas cantidades aparecen en los estadfsticos F usados para probar diferencias en la res- 
puesta media entre los bloques y entre los tratamientos. 

13.10 Estimacion en el diseno de bloques 
aleatorizado 

El intervalo de confianza para la diferencia entre un par de medias de tratamiento en un diseno 
de bloques aleatorizado es completamente analogo al asociado con el diseno completamente 
aleatorizado (un caso especial del diseno de un factor) de la Seccion 13.7. Un intervalo de 
confianza de 100(1 — a)% para r ; — r ; . es 


( Yi.-Y ,-,.) 



donde n t = n r = b, el numero de observaciones contenido en una media de tratamiento y 
S = VMSE. La diferencia entre los intervalos de confianza para los disenos completamente 
aleatorizado y de bloques aleatorizado es que el valor t a ^ esta basado en v = n — b — k + 1 
= (b — 1) (fc — 1) grados de libertad y que S, que aparece en la expresion anterior, se obtiene 
de la tabla ANOVA asociada con el diseno de bloques aleatorizado. 


EJEMPLO 13.6 Construya un intervalo de confianza de 95% para la diferencia entre las respuestas medias a 
los tratamientos 1 y 2, Ejemplo 13.5. 

Solucion El intervalo de confianza para la diferencia en respuestas medias para un par de tratamientos 
es 

(Y,. - 

donde el ejemplo 1 025 esta basado en 6 grados de libertad. Para los tratamientos 1 y 2 tene- 
mos 

[2 

(.98 -2.63) ±(2.447) (.27) J o - 1.65 ± .47 = (-2.12,-1.18). 


Yi'rn) ± tafiSJ y, 
V b 


Entonces, con un nivel de confianza de 95%, concluimos que el tiempo medio de reaccion 
para el estfmulo 1 es entre 1.18 y 2.12 segundos menor que el tiempo medio de reaccion para 
el estfmulo 2. ■ 
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Ejercicios 

13.52 Consulte los Ejercicios 13.41 y 12.10. Encuentre un intervalo de confianza de 95% para la diferencia 
en tiempos medios de CPU necesarios para que las dos computadoras completen un trabajo. ^Como se 
compara su respuesta con la obtenida en el Ejercicio 12.10(c)? 

13.53 Consulte el Ejercicio 13.42. Construya un intervalo de confianza de 95% para la diferencia entre resis- 
tencias medias para los productos qulmicos A y B. 

13.54 Consulte el Ejercicio 13.45. Construya un intervalo de confianza de 90% para las diferencias en creci- 
miento medio para los metodos A y B. 

13.55 Consulte el Ejercicio 13.46. Construya un intervalo de confianza de 95% para la diferencia en la distan- 
cia media rodada cuando se usan cespedes Dasher y supremo Marvelgreen para siembra excesiva. 

13.56 Consulte el Ejercicio 13.47. Construya un intervalo de confianza de 95% para la diferencia entre las 
cantidades medias de petroleo extrafdo por los metodos 1 y 4. Compare la respuesta con la obtenida en 
el Ejercicio 13.31(b). 

13.57 Consulte el Ejercicio 13.49. Calcule la diferencia en las presiones medias para separar componentes que 
estan pegados con nfquel y hierro, usando un intervalo de confianza de 99%. 


13.11 Seleccion del tamano muestral 

El metodo para seleccionar el tamano muestral en el diseno de un factor (incluyendo el com- 
pletamente aleatorizado) o el diseno de bloques aleatorizado es una extension de los proce- 
dimientos de la Seccion 8.7. Centraremos nuestra atencion en el caso de tamanos muestrales 
iguales, n l = n 2 = • • • = n k , para tratamientos del diseno de un factor. El numero de observa- 
ciones por tratamiento es igual al numero de bloques b para el diseno de bloques aleatorizado. 
Entonces, el problema es determinar n l o b para estos dos disenos de manera que el experi- 
mento resultante contenga la cantidad de informacion que se desea. 

La determinacion de los tamanos muestrales sigue un procedimiento similar para ambos 
disenos; hacemos un resumen de un metodo general. Primero, el experimentador debe de- 
cidir sobre el parametro (o parametros) de interes principal. Por lo general esto comprende 
la comparacion de un par de medias de tratamiento. En segundo termino, el experimentador 
debe especificar un lfmite del error de estimacion que pueda ser tolerado. Una vez que esto 
se haya determinado, lo siguiente es seleccionar n ; (el tamano de la muestra de la poblacion o 
tratamiento i) o bien, de manera correspondiente, b (el numero de bloques para un diseno de 
bloques aleatorizado) que reducira el semiancho del intervalo de confianza para el parametro 
de modo que, en un nivel de confianza prescrito, sea menor o igual al lfmite especificado del 
error de estimacion. Debe destacarse que la solucion del tamano muestral siempre sera una 
aproximacion porque a es desconocida y una estimacion para cr es desconocida hasta que se 
obtenga la muestra. La mejor estimacion disponible para cr se usara para producir una solu¬ 
cion aproximada. llustramos el procedimiento con un ejemplo. 


EJ EM P LO 13.7 Se elaborara un diseno completamente aleatorizado para comparar cinco tecnicas de ensenan- 
za en grupos de tamanos iguales. Se desea que la estimacion de las diferencias en respuesta 
media en un examen de logros sea correcta hasta una variacion de no mas de 30 puntos de 
calificacion del examen, con probabilidad igual a .95. Se espera que las calificaciones del exa- 
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men para una tecnica de ensenanza determinada posean un margen aproximadamente igual a 
240. Encuentre el numero aproximado de observaciones necesarias para cada muestra con el 
fin de obtener la information especificada. 

Solucion El intervalo de confianza para la diferencia entre un par de medias de tratamiento es 


(Yj. — Yi',) ± taftS — + —. 


Por tanto, deseamos seleccionar n l y n v tal que 


/ 1 1 

tafiSJ — + - <30. 

V n i n i' 


El valor de cr es desconocido y S es una variable aleatoria. No obstante, una solucion 
aproximada para «, = n v se puede obtener si se conjetura que el valor observado de s sera mas 
o menos igual a un cuarto del margen. Asf, ,v ~ 240/4 = 60. El valor de t a/2 estara basado en 
(«i + n 2 + ■ ■ ■ + n 5 — 5) grados de libertad e incluso para valores pares moderados de n t , 1 025 
sera aproximadamente igual a 2. Entonces 


t.025$ 


“ (2)(60) 

rij Hi' 



= 30, 


o bien, 


tii = 32, 


i = 1,2,.. 


5. 


EJEMPLO 13.8 Se lleva a cabo un experimento para comparar los efectos toxicos de tres sustancias qufmicas 
en la piel de ratas. Se esperaba que la resistencia a las sustancias qufmicas variara de manera 
importante de una rata a otra. Por tanto, las tres sustancias se habfan de probar en cada rata 
para delinear las diferencias de una rata a otra. 

La desviacion estandar del error experimental era desconocida, pero experimentos anterio- 
res que comprendfan varias aplicaciones de una sustancia qufmica similar en el mismo tipo de 
rata sugerfan un margen de mediciones de respuesta igual a 5 unidades. 

Encuentre un valor para b tal que el error en la estimacion de la diferencia entre un par de 
medias de tratamiento es menor que 1 unidad, con probabilidad igual a .95. 

Solucion Un valor muy aproximado para s es un cuarto del margen, o sea ,y ~ 1.25. Entonces, deseamos 
seleccionar b para que 


1.025 S 



Como 1 025 dependent de los grados de libertad asociados con s 2 , que sera (n — b — k + 1), 
usaremos la aproximacion 1 025 ~ 2. Entonces, 


2 

(2) (1.25)./- = 1, o 13. 

V b 
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Aproximadamente trece ratas seran necesarias para obtener la informacion deseada. Como 
haremos tres observaciones (k = 3) por rata, nuestro experimento requerira que se hagan un 
total de n = bk = 13(3) = 39 mediciones. 

Los grados de libertad asociados con la estimacion resultante s 2 seran (n — b — k + 1) = 
39 —13 — 3 + 1= 24, con base en esta solucion. Por tanto, el valor calculado de t parecerfa 
adecuado para esta solucion aproximada. ■ 


Las soluciones de tamano muestral para los Ejemplos 13.7 y 13.8 son muy aproximadas 
y tienen la intention de dar solo una estimacion poco precisa del tamano muestral y de los 
costos consiguientes del experimento. Las longitudes reales de los intervalos de confianza 
resultantes dependeran de los datos que se observen en realidad. Estos intervalos pueden no 
tener las longitudes exactas especificadas por el experimentador pero tendran el coeficiente 
de confianza necesario. Si los intervalos resultantes son todavia demasiado largos, el experi¬ 
mentador puede obtener informacion sobre cr cuando se recolecten los datos y puede volver 
a calcular una mejor aproximacion al numero de observaciones por tratamiento (n ; o /;) a 
medida que avance el experimento. 


Ejercicios 

13.58 Consulte el Ejercicio 13.9. 

a Aproximadamente, ^cuantas muestras por mezcla de concreto deben prepararse para permitir el calculo 
de la diferencia en las resistencias medias para un par preseleccionado de muestras hasta no mas de .02 
tonelada por pulgada cuadrada? Suponga el conocimiento de los datos dados en el Ejercicio 13.9. 

b ^Cual es el numero total de observaciones requerido en todo el experimento? 

13.59 Consulte los Ejercicios 13.10 y 13.27(a). ^Aproximadamente cuantas observaciones serfan necesarias 

para que el error de estimacion de /jl a no sea mayor quelO unidades? Use un coeficiente de confianza de 

95%. 

13.60 Consulte los Ejercicios 13.10 y 13.27(c). 

a Suponiendo tamanos muestrales iguales para cada tratamiento, ^aproximadamente cuantas observa¬ 
ciones del metodo A y del metodo B son necesarias para calcular /x A — p, B con un error no mayor que 
20 unidades? Use un coeficiente de confianza de 95%. 

b ^Cual es el numero total de observaciones requerido en todo el experimento? 

13.61 Consulte el Ejercicio 13.45. 

a ^Cuantos lugares se necesitan usar para calcular la diferencia entre el crecimiento medio para cua- 
lesquiera dos preparaciones de suelo especificadas hasta no mas de 1 unidad, con coeficiente de 
confianza de .95? 

b ^Cual es el numero total de observaciones necesarias en todo el experimento? 

13.62 Consulte los Ejercicios 13.47 y 13.55. ^Cuantos lugares deben usarse si se desea calcular /jl { — p, 4 hasta 

no mas de .5 unidad, con coeficiente de confianza .95? 


13.12 Intervalos de confianza simultaneos 
para mas de un parametro 

Los metodos de la Section 13.7 se pueden usar para construir intervalos de confianza de 
100(1 — a)% para una media de tratamiento individual o para la diferencia entre un par de me¬ 
dias de tratamiento en un diseno de un factor. Suponga que en el curso de un analisis deseamos 
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construir varios de estos intervalos de confianza. El metodo de la Seccion 13.10 se puede usar 
para comparar un par de medias de tratamiento en un diseno de bloques aleatorizado. Aun 
cuando es cierto que cada intervalo incluira el parametro estimado con probabilidad (1 — a), 
^cual es la probabilidad de que todos los intervalos contengan sus respectivos parametros? El 
objetivo de esta seccion es presentar un procedimiento para formar conjuntos de intervalos 
de confianza para que el coeficiente de confianza simultaneo sea no menor que (1 — a) para 
cualquier valor especificado de a. 

Suponga que deseamos hallar intervalos de confianza I v I 2 ,..., l m para parametros 0 X , 
0 2 ,..., 0 m para que 


P(0j e Ij para toda j = 1, 2,..., m) > 1 — a. 

Esta meta se puede alcanzar si se usa una desigualdad de probabilidad simple, conocida como 
desigualdcid de Bonferroni (recuerde el Ejercicio 2.104). Para cualesquiera eventos A v A 2 ,..., 
A m , tenemos 


Aj n a 2 n---n A m — Aj u a 2 u■ ■ • u A m . 


Por tanto, 


p(A x ha, n---n A m ) = 1 - p(a x ua 2 u-uaj 


Tambien, de la ley aditiva de probabilidad sabemos que 


P(A\ UA 2 U---UA m )<£>(A,). 

7=1 

En consecuencia, obtenemos la desigualdad de Bonferroni 

m 

P{A\ n a 2 n ■ • • n a,„) > 1 - £>(Aj). 

7 = 1 

Suponga que P ((/ e /.) = 1 - a - y sea A ; el evento { () ] e If. Entonces, 

m m 

P{e 1 E/l. I,n ) 2= 1 - J2 P(9 J * I J ) = 1 “ I Z a i- 

7 = 1 7=1 

Si todas las a-, para j = 1,2,..., m, se seleccionan iguales a a , podemos ver que el coeficiente 
de confianza simultaneo de los intervalos f, para j = 1,2,..., m, podrfa ser de solo (1 — ma ), 
que es menor que (1 — a) si m > 1. Un coeficiente simultaneo de confianza de al menos (1 — a) 
puede asegurarse si se seleccionan los intervalos de confianza f, para j = 1,2 m, para 
que Yl”j= i a i = a - Una forma de lograr este objetivo es que cada intervalo se construya para que 
tenga coeficiente de confianza 1 — (a/m). Aplicamos esta tecnica en el siguiente ejemplo. 


EJEMPLO 13.9 Para los cuatro tratamientos dados en el Ejemplo 13.2 construya intervalos de confianza para 

todas las comparaciones de la forma /j., — /x■, con coeficiente simultaneo de confianza no me¬ 
nor que .95. 
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Solucion El intervalo de confianza apropiado de 100(1 — a)% para una sola comparacion (por ejemplo 
(Mi - Mi) es 


(Ju~Y 2 .) 


ta/2 S. 


1 1 
n\ n 2 ' 


Como hay seis de estas diferencias por considerar, cada intervalo debe tener coeficiente de 
confianza 1 — (a/6). Entonces, el correspondiente valor t es t a / 2(6) = t a / l2 . Como deseamos que 
el coeficiente de confianza simultaneo sea al menos .95, el valor t apropiado es r 05/12 = 1 00417 - 
Usando la Tabla 5, Apendice 3, el valor de tabla disponible mas cercano es 1 005 , de modo que 
usaremos este para calcular el resultado deseado. El MSE para los datos del Ejemplo 13.2 esta 
basado en 19 grados de libertad, de modo que el valor en la tabla es t lm = 2.861. 

Como s = VMSE = V63 = 7.937, el intervalo para /jl 1 — (jl 2 entre los seis con coefi¬ 
ciente de confianza simultaneo de al menos .95 es 


/r, - /z 2 : (75.67 - 78.43) 


2.861(7.937) 




o -2.76 ± 12.63. 


De manera analoga, el conjunto completo de seis intervalos realizados es 

Mi — M 2 ' —2.76 ± 12.63 
Mi — M3 : 4.84 ± 13.11 

Mi — M4 : —12.08 ± 14.66 
M 2 — M3 ; 7.60 ± 12.63 

M 2 — M4 : —9.32 ± 14.23 
M3 — M4 : —16.92 ± 14.66. 


No podemos lograr nuestro objetivo de obtener un conjunto de seis intervalos de confianza con 
coeficiente simultaneo de confianza de al menos .95 porque las tablas t del texto son dema- 
siado limitadas. Desde luego, existen tablas mas extensas de las distribuciones t. Como cada 
uno de nuestros seis intervalos tiene coeficiente de confianza .99, podemos decir que los seis 
intervalos anteriores tienen un coeficiente de confianza simultaneo de al menos .94. La apli- 
cacion Student’s t Probabilities and Quantiles, aplicado con 19 grados de libertad, da 1 00417 = 
2.9435. Se pueden obtener intervalos con coeficiente de confianza simultanea de .9499 al 
sustituir t 00417 = 2.9435 en lugar de 2.861 en los calculos previos. ■ 


Destacamos que la tecnica presentada en esta seccion garantiza probabilidades simultaneas 
de al menos 1 — a. La probabilidad simultanea real puede ser mucho mayor que el valor 
nominal l — a. Otros metodos para construir intervalos de confianza simultaneos se pueden 
hallar en los libros citados en la bibliograffa que esta al final de este capftulo. 


Ejercicios 

13.63 Consulte el Ejemplo 13.9. Los seis intervalos de confianza para /jl- — \x v se obtuvieron mediante el uso 
de un valor aproximado (debido a la limitacion de la informacion en la Tabla 5, Apendice 3) para t 00417 . 
^Por que difieren en longitud algunos intervalos? 

13.64 Consulte el Ejercicio 13.63 y el Ejemplo 13.9. 
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a Use el valor exacto para r 00417 dado en el Ejemplo 13.9 para dar un intervalo de 99.166% para 
/Xj — fjL 2 . Este intervalo es uno de los seis intervalos simultaneos para fi i — /jl r con coeficiente de 
confianza simultaneo no menor que .94996 ~ .95. 

b ^Cual es la razon de las longitudes de los intervalos para /Xj — /x, obtenidas en el Ejemplo 13.9 y el 
inciso a? 

c ^Como se compara la razon que usted obtuvo en el inciso b con la razon f 005A00417? 
d Con base en los incisos b, c y el intervalo para /Xj — /x 3 dado en el Ejemplo 13.9 proporcione un 
intervalo de 99.166% para /jl 3 — /x 3 . A1 igual que antes, este es uno de los seis intervalos simultaneos 
para comparar /x, y /x ; . con coeficiente de confianza simultaneo no menor que .94996 ~ .95. 

13.65 Consulte el Ejercicio 13.13. Construya intervalos de confianza para todas las diferencias posibles entre 
los tiempos medios de maniobra para las tres clases de vehfculos, de modo que el coeficiente simultaneo 
de confianza sea al menos .95. Interprete los resultados. 

13.66 Consulte el Ejercicio 13.12. Despues de ver los datos, un lector del informe de Wheeler y colegas noto 
que la diferencia maxima entre las medias muestrales ocurre cuando se comparan concentraciones altas 
y bajas de acetonitrilo. Si se desea un intervalo de confianza para la diferencia en las medias poblacio- 
nales correspondientes, ^como sugerirfa usted construir este intervalo? 

13.67 Consulte el Ejercicio 13.45. Construya intervalos de confianza para todas las diferencias posibles entre 
las medias de tratamiento (preparation del suelo), para que el coeficiente simultaneo de confianza sea al 
menos .90. 

13.68 Consulte los Ejercicios 13.31 y 13.47. Como el metodo 4 es el mas costoso, se desea compararlo contra 
los otros tres. Construya intervalos de confianza para las diferencias /x 3 — /x 4 , /x 0 — /x 4 y /x 3 — /x 4 para 
que el coeficiente simultaneo de confianza sea al menos .95. 


13.13 Analisis de varianza usando modelos lineales 

Los metodos para analizar los modelos lineales presentados en el Capftulo 11 se pueden adap- 
tar para su uso en el ANOVA. Ilustramos el metodo al formular un modelo lineal para datos 
obtenidos por medio de un diseno completamente aleatorizado que comprende k = 2 trata- 
mientos. 

Sea Yjj la variable aleatoria en la j-esima observation del tratamiento i, para i = 1,2. 
Definamos una variable xficticia o indicadora, de la siguiente manera: 

1, si la observacion es de la poblacion 1. 

x = ■ 

0, de otro modo. 

Aunque dichas variables mudas se pueden definir en numerosas formas, esta definition es 
consistente con la codification empleada en el SAS y otros programas de computadora para 
analisis estadfstico. Observe que con esta codification x es 1 si la observacion se toma de la 
poblacion 1 y x es 0 si la observacion se toma de la poblacion 2. Si usamos x como una varia¬ 
ble independiente en un modelo lineal, podemos modelar Y :] como 

Yij = /3o + /3\X + Sij, 

donde e t j es un error aleatorio distribuido normalmente con Eie^) = 0 y Vie-) = cr. En este 
modelo, 


Mi — E(Yij) — po +/3i(l) — /3o + £ 1 , 
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y 

M2 = E{Y 2j ) =A>+A(0) = &,. 

Entonces, se deduce que = /jl 1 — /x 2 y una prueba de la hipotesis /x, — /x 2 = 0 es equivalen- 
te a la prueba de que /3 l = 0. Nuestra intuicion sugerirfa que p 0 = Yo. y $ i = K|. — IS* 
son buenos estimadores de /3 0 y /3,; de hecho, se puede demostrar (prueba omitida) que es- 
tos son los estimadores de mmimos cuadrados obtenidos al ajustar el modelo lineal anterior. 
Ilustramos el uso de esta tecnica volviendo a analizar los datos presentados en el Ejemplo 13.1. 


EJEMPLO 13.10 Ajuste un modelo lineal apropiado a los datos del Ejemplo 13.1 y haga una prueba para ver si 
hay una diferencia importante entre /jl 1 y /x 2 . 

Solucion El modelo, como ya indicamos antes, esta dado por 

Yjj /3f, Y (j\X ~E Sj j , 

donde 

1, si la observacion es de la poblacion 1, 

x — ■ 

0, de otro modo. 

Las matrices empleadas para los estimadores de mmimos cuadrados son entonces 


XX = 


Y = 


-6.1 - 


-1 

r 

7.1 


1 

1 

7.8 


1 

1 

6.9 


1 

1 

7.6 


1 

1 

8.2 

, X = 

1 

1 

9.1 


1 

0 

8.2 


1 

0 

8.6 


1 

0 

6.9 


1 

0 

7.5 


1 

0 

.7.9. 


.1 

0. 


12 6 
6 6 


(x'xr 1 = 


1/6 

- 1/6 


- 1/6 

1/3 


Los estimadores de mmimos cuadrados estan dados por 


4 


(X'X) _1 X'Y 


1/6 

—1/6 " 

"91.9" 


"8.033" 

-1/6 

1/3. 

43.7 


-.75 


Observe que = 8.033 = Y 2 . y j&j = —.75 = Y\, — Y 2 .. 
Ademas, 


SSE = Y'Y-jS'x'Y =5.8617 


es igual que la SSE calculada en el Ejemplo 13.1. Por tanto, s 2 = SSE l(n — 2) = .58617 y 
= V-58617 = .7656. 


s 
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Para probar H 0 : (3 l = 0, construimos el estadfstico t (vease la Seccion 11.12): 


& -o 

■A/cTT 


-.75 

.7656 VV3 


-1.697. 


Como estamos interesados en una prueba de dos colas, el valor p asociado es 2 P(t< — 1.697) = 
2 P{t > 1.697), donde 1 esta basada en 10 grados de libertad. Entonces, usando la Tabla 5, 
Apendice 3, obtenemos .05 < Pit > 1.697) < .10 y .10 < valor p < .20. Por tanto, para cual- 
quier valor a menor que 0.1, no podemos rechazar //„. Esto es, hay suficiente evidencia para 
indicar que p , 1 y /jl 2 difieren. 

Esta prueba 1 es equivalente a la prueba F del Ejemplo 13.1. De hecho, el cuadrado del 
valor 1 observado es el valor F observado en el Ejemplo 13.1. ■ 


Ilustramos el metodo del modelo lineal para un analisis mas complicado de problema de 
varianza al considerar un diseno de bloques aleatorizado. 


EJEMPLO 13.11 Se realizo un experimento para comparar los efectos de cuatro sustancias qufmicas A, B, C y 
D en la resistencia al agua en textiles. Se usaron tres rollos diferentes de material I, II y III, con 
cada uno de los tratamientos qufmicos aplicado a una pieza de material cortado de cada uno de 
los rollos. Los datos se dan en la Tabla 13.7. Escriba un modelo lineal para este experimento 
y pruebe la hipotesis de que no hay diferencias entre las resistencias medias al agua para las 
cuatro sustancias qufmicas. Use a = .05. 

Solucion Al formular el modelo, definimos [3 () como la respuesta media al tratamiento D en el material 
del rollo III y luego introducimos una variable indicadora distinta para cada tratamiento y para 
cada rollo de material (bloque). El modelo es 


Y — f 3 o + f 3 \X\ + P 2 X 2 + ( 33 X 2 + P4X4 + /35X5 + s, 


donde 


xi = 


X2 = 


x 3 = 


1, 

0 , 

1, 

0, 


si se usa material del rollo I, 
de otro modo, 

si se usa material del rollo II, 
de otro modo, 

si se usa el tratamiento A, 
de otro modo, 


Tabla 13.7 Datos para el Ejemplo 13.11 


Rollo de material 


Tratamientos 


A 

B 

C 

D 

I 

10.1 

11.4 

9.9 

12.1 

II 

12.2 

12.9 

12.3 

13.4 

III 

11.9 

12.7 

11.4 

12.9 
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X4 = 

X5 = 


1, 

0 , 

1 , 

0 , 


si se usa el tratamiento B, 
de otro modo, 
si se usa el tratamiento C, 
de otro modo. 


Buscamos probar la hipotesis de que no hay diferencias entre las medias de tratamiento, que 
es equivalente a H 0 : /3 3 = P 4 = [3 5 = 0. Asf, debemos ajustar un modelo completo y uno re- 
ducido. (Vea la Section 11.14.) 

Para el modelo completo, tenemos 


- 10 . 1 - 



■ 1 

1 

0 

1 

0 

0 - 

12.2 



1 

0 

1 

1 

0 

0 

11.9 



1 

0 

0 

1 

0 

0 

11.4 



1 

1 

0 

0 

1 

0 

12.9 



1 

0 

1 

0 

1 

0 

12.7 



1 

0 

0 

0 

1 

0 

9.9 

y 

x = 

1 

1 

0 

0 

0 

1 

12.3 



1 

0 

1 

0 

0 

1 

11.4 



1 

0 

0 

0 

0 

1 

12.1 



1 

1 

0 

0 

0 

0 

13.4 



1 

0 

1 

0 

0 

0 

.12.9. 



. 1 

0 

0 

0 

0 

0. 


Un poco de algebra de matrices da como resultado, para este modelo completo, 
SSE C = Y'Y-pX'Y = 1721.760 - 1721.225 = .535. 

El modelo reducido relevante es 


Y — fio + Pi*i + P 2 X 2 + e. 


y la matriz X correspondiente esta formada por solo las primeras tres columnas de la matriz X 
dada para el modelo completo. Entonces obtenemos 


y 


p = (x’xy l x'Y 


12.225 

-1.350 

.475 


SSE* = Y'Y — p X'Y = 1721.760 - 1716.025 = 5.735. 


Se deduce que la relation F apropiada para comparar estos modelos completo y reducido es 


(SSEr -SSE c)/(k-g) _ (5.735 - ,535)/(5 — 2) _ 1.733 
SSE c /(« ~[k + 1]) (.535)/(12 — 6) .0892 


La F tabulada para a = .05, v 1 = 3, y v 2 = 6 es 4.76. En consecuencia, si escogemos 
a = .05, rechazamos la hipotesis nula y concluimos que los datos presentan suficiente eviden- 
cia para indicar que existen diferencias entre las medias de tratamiento. El valor p asociado 
esta dado por P(F > 19.4). La Tabla 7, Apendice 3, establece que el valor p < .005. La apli- 
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cacion F-Rcitio Probabilities and Quantiles, aplicada con 3 grados de libertad en el numerador 
y 6 grados de libertad en el denominador dan valor p = P(F > 19.4) = .00172. La prueba 
F empleada en este ejemplo es equivalente a la que hubiera sido producida por los metodos 
explicados en la Seccion 13.9. ■ 


A pesar de ser una tecnica muy util, el metodo del modelo lineal para el calculo del ANOVA 
se usa por lo general solo cuando los calculos se hacen en computadora. Las formulas de cal¬ 
culo indicadas anteriormente en el capltulo son mas convenientes cuando se hacen calculos 
manualmente. Observe que si hay k tratamientos comprendidos en un estudio, el metodo de 
las “variables ficticias’' requiere que definamos k — I variables ficticias si deseamos usar el 
metodo del modelo lineal para analizar los datos. 


Ejercicios 

13.69 Consulte el Ejemplo 13.11. En el Ejercicio 13.37 usted interpreto los parametros del modelo para un 
diseno de bloques aleatorizado en terminos de la respuesta media para cada tratamiento en cada bloque. 
En terminos del modelo con variables ficticias dado en el Ejemplo 13.11, /3 0 es la respuesta media al 
tratamiento D para el rollo de material (bloque) III. 

a En terminos de los valores (3 , ^cual es la respuesta media al tratamiento A del bloque III? 
b Con base en su respuesta al inciso a, ),cual es una interpretacion del parametro yS 3 ? 

13.70 Consulte el Ejercicio 13.10. 

a Conteste la pregunta planteada en el Ejercicio 13.10 ajustando los modelos lineales complete y redu- 
cido. Pruebe usando a = .05. 

b Use los calculos para el modelo completo del inciso a para probar la hipotesis de que no hay diferen- 
cia entre las medias para los metodos A y C. Pruebe usando a = .05. 
c Indique los niveles de significancia alcanzados para las pruebas realizadas en los incisos a y b. 

13.71 Consulte el Ejercicio 13.42. Conteste el inciso a al ajustar los modelos completo y reducido. 

13.72 Consulte el Ejercicio 13.45. Conteste el inciso b al construir una prueba F usando los modelos lineales 
completo y reducido. 


13.14 Resumen 

El diseno de un factor (incluyendo el diseno completamente aleatorizado) y el diseno de 
bloques aleatorizado son ejemplos de experimentos que comprenden una y dos variables cuali- 
tativas independientes, respectivamente. El ANOVA divide las sumas totales de cuadrados, SS 
total, en partes asociadas con cada variable independiente y error experimental. Los cuadrados 
medios asociados con cada variable independiente pueden compararse con el MSE para ver 
si el valor de los cuadrados medios son suficientemente grandes como para implicar que la 
variable independiente tiene algun efecto sobre la respuesta. Los intervalos de confianza para 
la respuesta media a un tratamiento individual o la diferencia en las respuestas medias para 
dos tratamientos preseleccionados son modihcaciones sencillas de intervalos presentadas en 
capltulos anteriores. La desigualdad de Bonferroni se utilizo para construir un conjunto de in- 
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tervalos de confianza con coeficiente de confianza simultaneo de al menos 1 — a. Finalmente, 
introdujimos el metodo de variable ficticia que permite el uso de metodologfa de modelos 
lineales para realizar un analisis de varianza. 

En este capltulo hemos presentado una introduccion muy breve al analisis de varianza y su 
tema asociado, el diseno de experimentos. Pueden disenarse experimentos para investigar el 
efecto de numerosas variables cuantitativas y cualitativas en una respuesta. Estas pueden ser 
variables de gran interes para el experimentador, asf como variables de ruido como son los 
bloques, que pueden contribuir a una variacion no deseada que tratamos de separar del error 
experimental. Cuando se disenan de modo apropiado, estos experimentos aportan datos que 
pueden ser analizados usando un metodo ANOVA. Un analisis mas amplio de los conceptos 
basicos de diseno experimental y del analisis de experimentos esta en la bibliografia. 
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Ejercicios complementarios 

13.73 Suponga que n = bk unidades experimental se encuentran disponibles para ser utilizadas en un experi- 
mento empleado para comparer k tratamientos. Si se pueden formar bloques en una forma significativa, 
icomo deben ser identificadas las unidades experimentales de cada bloque? 

13.74 Consulte el Ejercicio 13.73. 

a Si se emplea un diseno completamente aleatorizado, ^corno seleccionarfa usted las unidades experi¬ 
mentales que estan asignadas a los tratamientos diferentes? 
b Si se emplea un diseno de bloques aleatorizado, ^,como seleccionarfa usted las unidades experimen¬ 
tales que estan asignadas a cada uno de los k tratamientos? 

13.75 Tres agentes para limpiar la piel se usaron en tres personas. Para cada persona, tres areas de piel se ex- 
pusieron a un contaminante y despues se limpiaron usando uno de los tres agentes de limpieza. Despues 
de 8 horas se midio el contaminante residual, con los siguientes resultados: 


SST = 1.18, 


SSB = .78, 


SSE = 2.24. 
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a ^Cuales son las unidades experimentales y cuales son los bloques en este experimento? 
b Pruebe la hipotesis de que no hay diferencias entre las medias de tratamiento, usando a — .05. 

13.76 Consulte el Ejercicio 13.9. Suponga que la arena utilizada en las mezclas para las muestras 1-4 provino 
de la fosa A, la de las muestras 5-8 de la fosa B y la de las muestras 9-12 de la fosa C. Analice los datos 
suponiendo que las necesidades para un bloque aleatorizado son satisfechas con tres bloques consisten- 
tes, respectivamente, en las muestras 1, 2, 3 y 4; en las muestras 5, 6, 7 y 8; y en las muestras 9, 10, 11 

y 12 . 

a En el nivel de significancia de 5%, B hay evidencia de diferencias en resistencia del concreto debido 
a la arena usada? 

b i,Hay evidencia, en el nivel de significancia de 5%, de diferencias en las resistencias promedio entre 
los cuatro tipos de concreto usado? 

c ^La conclusion del inciso b contradice la conclusion obtenida en el Ejercicio 13.9? 

13.77 Consulte el Ejercicio 13.76. Sean /x A y /jl b , respectivamente, las resistencias medias de las muestras de 
concreto preparadas de la mezcla A y la mezcla B. 

a Encuentre un intervalo de confianza de 95% para (/x A — /r B ). 

b El intervalo encontrado en el inciso a ^es el mismo intervalo hallado en el Ejercicio 13.26(b)? ^Por 
que si o por que no? 

13.78 Se initio un estudio para investigar el efecto de dos medicamentos, administrados simultaneamente, 
para reducir la presion sangulnea en personas. Se decidio usar tres niveles de cada medicamento e incluir 
las nueve combinaciones en el experimento. Nueve pacientes con presion alta fueron seleccionados para 
el experimento y aleatoriamente se asigno uno a cada una de las nueve combinaciones de medicamento. 
La respuesta observada fue una reduction en la presion sangulnea en un intervalo fijo de tiempo. 

a ^Es este un diseno de bloques aleatorizado? 

b Suponga que dos pacientes se asignaron aleatoriamente a cada una de las nueve combinaciones de 
medicamento. B Que tipo de diseno experimental es este? 

13.79 Consulte el Ejercicio 13.78. Suponga que se empleara un diseno balanceado y completamente aleatori¬ 
zado y que experimentos anteriores sugieren que <x = 20. 

a ^Cuantas repeticiones serfan necesarias para calcular cualquier media de tratamiento (combination 
de medicamento) correcta, con variation de no mas de ± 10 con probabilidad .95? 
b ^,De cuantos grados de libertad se dispondra para calcular a 2 cuando se use el numero de repeticiones 
determinado en el inciso a? 

c Determine la mitad de la amplitud aproximada de un intervalo de confianza de 95% para la diferen- 
cia en las respuestas medias para dos tratamientos cuando se use el numero de repeticiones determi¬ 
nado en el inciso a. 

13.80 Un distribuidor tiene en existencia tres autos (modelos A, B y C) de la misma marca pero diferentes 
modelos. Con el deseo de comparar el rendimiento en millas obtenido de estos diferentes modelos, un 
cliente hizo arreglos para probar cada uno de los autos con cada una de tres marcas de gasolina (marcas 
X, Y y Z). En cada intento, se vertio un galon de gasolina en el tanque vatio y el auto se hizo funcionar 
sin detenerse hasta agotar la gasolina. La tabla siguiente muestra el numero de millas recorridas en cada 
uno de los nueve intentos. 


Distancia (millas) 


Marca de gasolina 

Modelo A 

Modelo B 

Modelo C 

X 

22.4 

17.0 

19.2 

Y 

20.8 

19.4 

20.2 

Z 

21.5 

18.7 

21.2 
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a ^E1 cliente debe concluir que los diferentes modelos de autos dan distinto rendimiento medio de 
gasolina? Pruebe con un nivel a = .05? 
b ^Los datos indican que la marca de gasolina afecta el rendimiento de esta? 

13.81 Consulte el Ejercicio 13.80. Suponga que el rendimiento de la gasolina no esta relacionado con su marca. 
Realice un analisis apropiado de los datos para un diseno completamente aleatorizado con tres trata- 
mientos. 

a ^Debe el cliente concluir que los tres autos difieren en rendimiento de gasolina? Pruebe en el nivel 
a = .05. 

b Comparando su respuesta para el Ejercicio 13.80(a) con su respuesta para el inciso a de este ejercicio, 
^puede sugerir una razon por la cual un diseno en bloques puede no ser inteligente en ciertos casos? 
c ^Por que podrfa ser un error analizar los datos en la forma sugerida en el inciso a? 

13.82 Con la esperanza de atraer mas viajeros, una compafua de transportes urbanos planea tener servicio de 
autobuses express de una terminal suburbana al centra financiero de la ciudad. Estos autobuses deben 
ahorrar tiempo de viaje. La ciudad decide realizar un estudio del efecto de cuatro planes diferentes (por 
ejemplo un carril especial y semaforos sincronizados) en el tiempo de viaje de los autobuses. Los tiem- 
pos de viaje (en minutos) se miden para varios dfas habiles durante un viaje en horas pico cuando cada 
uno de los planes se esta aplicando. Los resultados aparecen en la tabla siguiente. 


Plan 

1 

2 

3 

4 

27 

25 

34 

30 

25 

28 

29 

33 

29 

30 

32 

31 

26 

27 

31 



24 

36 



a ^Que tipo de diseno experimental se utilizo? 

b r,Hay evidencia de una diferencia en los tiempos medios de viaje para los cuatro planes? Use 
a = 0 . 01 . 

c Forme un intervalo de confianza de 95% para la diferencia entre el plan 1 (carril express) y el plan 3 
(un control: no hay arreglos especiales de viaje). 

13.83 Se realizo un estudio para comparar el efecto de tres niveles de digitalina en el nivel de calcio en el 
musculo cardiaco de perros. Se omite una description del procedimiento experimental real, pero es sufi- 
ciente tomar nota de que el nivel general de ingesta de calcio varfa de un animal a otro, de modo que la 
comparacion de los niveles de digitalina (tratamientos) tuvo que ser formada con bloques de musculos 
cardiacos. Esto es, el tejido para un musculo cardiaco fue considerado corno un bloque y se hicieron 
comparaciones de los tres tratamientos dentro de un musculo determinado. La ingesta de calcio para 
los tres niveles de digitalina. A, B y C, se compararon con base en los musculos del corazon de cuatro 
perros. Los resultados se muestran en la siguiente tabla. 


Perros 

1 

2 

3 

4 

A 

C 

B 

A 

1342 

1698 

1296 

1150 

B 

B 

A 

C 

1608 

1387 

1029 

1579 

C 

A 

C 

B 

1881 

1140 

1549 

1319 
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a Calcule las sumas de cuadrados para este experimento y construya una tabla ANOVA. 
b ^Cuantos grados de libertad estan asociados con la SSE? 

c ^Los datos presentan suficiente evidencia para indicar una diferencia en la ingesta media de calcio 
para los tres niveles de digitalina? 

d ^Los datos indican una diferencia en la ingesta media de calcio para los musculos cardiacos de los 
cuatro perros? 

e Indique la desviacion estandar de la diferencia entre las ingestiones medias de calcio para dos niveles 
de digitalina. 

f Encuentre un intervalo de confianza de 95% para la diferencia en las respuestas medias entre los 
tratamientos A y B. 

13.84 Consulte el Ejercicio 13.83. ^Aproximadamente cuantas repeticiones se necesitan para cada nivel de 
digitalina (cuantos bloques) para que el error de estimar la diferencia en la respuesta media para un par 
de niveles de digitalina sea menor que 20, con probabilidad .95? Suponga que se harlan observaciones 
adicionales dentro de un diseno de bloques aleatorizado. 

13.85 Se realizo un diseno completamente aleatorizado para comparar los efectos de cinco estlmulos en los 
tiempo de reaccion. Se emplearon 27 personas en el experimento, que se realizo usando un diseno com¬ 
pletamente aleatorizado. Sin considerar los resultados del ANOVA, se desea comparar los estlmulos A 
y D. Los tiempos de reaccion (en segundos) son como se muestra en la siguiente tabla. 


Estlmulo 


A 

B 

C 

D 

E 


.8 

.7 

1.2 

1.0 

.6 


.6 

.8 

1.0 

.9 

.4 


.6 

.5 

.9 

.9 

.4 


.5 

.5 

1.2 

1.1 

.7 



.6 

1.3 

.7 

.3 



.9 

.8 





.7 




Total 

2.5 

4.7 

6.4 

4.6 

2.4 

Media 

.625 

.671 

1.067 

.920 

.480 


a Realice un ANOVA y pruebe para una diferencia en los tiempos medios de reaccion debida a los 
cinco estlmulos. Indique Umites para el valor p. 

b Compare los estlmulos A y D para ver si hay una diferencia en los tiempos medios de reaccion. (,Que 
se puede decir acerca del nivel de significancia alcanzado? 

13.86 Debido a que esperarfamos que el tiempo medio de reaccion varle de una persona a otra, el experimento 
del Ejercicio 13.85 pudo haberse realizado en forma mas eficaz con el uso de un diseno de bloques 
aleatorizado con personas como bloques. En consecuencia, se emplearon cuatro personas en un nuevo 
experimento y cada persona fue sometida a cada uno de los cinco estlmulos en orden aleatorio. Los 
tiempos de reaccion (en segundos) son los mostrados en la siguiente tabla. Realice un ANOVA y pruebe 
las diferencias en los tiempos medios de reaccion para los cuatro estlmulos. 


Sujeto 


Estlmulo 


A 

B 

C 

D 

E 

1 

.7 

.8 

1.0 

1.0 

.5 

2 

.6 

.6 

1.1 

1.0 

.6 

3 

.9 

1.0 

1.2 

1.1 

.6 

4 

.6 

.8 

.9 

1.0 

.4 
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13.87 Consulte el Ejercicio 13.46. Construya intervalos de confianza para comparar cada una de las variedades 
de cesped con el supremo Marvelgreen, en forma tal que el coeficiente simultaneo de confianza sea al 
menos .95. Interprete los resultados. 

13.88 Demuestre que 


SS total = SST + SSB + SSE 


para un diseno de bloques aleatorizado, donde 

b k 

sse = J2 E (F ? - Y -j ~ Y -+ F > 2 - 

j =1 i=l 

*13.89 Considere el siguiente modelo para las respuestas medidas en un diseno de bloques aleatorizado que 
contiene b bloques y k tratamientos: 

Yij j-L 4" T, + [3j Ejj, 

donde Y tj = respuesta al tratamiento i en el bloque j, 

/x = media general, 

T t = efecto no aleatorio del tratamiento i, donde Y^=i T / = 0> 

Pj = efecto aleatorio del bloque j, donde las son variables aleatorias independientes, distribui- 
das normalmente, con E (J3j) = 0 y V(J3j) — cr^, para j = 1,2 ,,b. 

Ejj = terminos aleatorios de error donde las e- son variables aleatorias independientes, distribui- 
das normalmente, con E(e ; .) = 0 y V (e, ; ) =cr para i = 1, 2, ..., k yj = 1,2, ... ,b. 

Ademas, suponga que las y las e,y tambien son independientes. Este modelo difiere del presentado en 
la Seccion 13.8 en que se supone que los efectos de bloque son variables aleatorias en lugar de constan- 
tes fijas pero desconocidas. 

a Si el modelo que acabamos de describir es apropiado, demuestre que las observaciones tomadas de 
bloques diferentes son independientes entre si. Esto es, demuestre que Y t - y JE, son independientes si 
A /, como son Y tj y Y rj . si i + i' yj + j'. 

b De acuerdo con el modelo que acabamos de describir, deduzca la covarianza de dos observaciones 
del mismo bloque. Esto es, encuentre Cov(JE, Y^j) si i A i'. 

c Dos variables aleatorias que tienen una distribucion normal conjunta son independientes si y solo si 
la covarianza de ellas es 0. Use el resultado del inciso b para determinar las condiciones en las que 
dos observaciones del mismo bloque son independientes entre si. 

*13.90 Consulte el modelo para el diseno de bloques aleatorizado con efecto de bloque al azar dado en el 
Ejercicio 13.89. 

a Indique el valor y la varianza esperados de Yy. 

b Con Yj, denote el promedio de todas las respuestas al tratamiento i. Use el modelo para el dise¬ 
no de bloques aleatorizado para deducir E(Yj,) y V(E,.). i : Y,, es un estimador insesgado para la 

respuesta media al tratamiento i? ^Por que si o por que no? Observe que \ /(E,.) depende de b y de 

2 2 
°)3 y °a- 

c Considere Yj, — Yj*, para i A i'. Demuestre que E{Yj, — E,-/.) = r,- — iy. Este resultado implica 
que Yj, — Yj', es un estimador insesgado de la diferencia en los efectos de los tratamientos i e i'. 

d Deduzca V(Yj, — E,v). Observe que V{Y t , — Yj',) depende solo de b y <r ; 2 . 

*13.91 Consulte el modelo para el diseno de bloques aleatorizado con efecto de bloque al azar dado en el 
Ejercicio 13.89 y denote con y ■ el promedio de todas las respuestas del bloque j. Deduzca 
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a E(X.j)yV{Y.j). 
b E(MST). 
c £(MSB). 
d E(MSE). 


*13.92 Consulte el modelo para el diseno de bloques aleatorizado con efecto de bloque al azar dado en el 
Ejercicio 13.89 y los resultados obtenidos en el Ejercicio 13.91(c) y (d). De un estimador insesgado 
para 

a of. 

b of. 

*13.93 Suponga que Y { , Y 2 ,...,Y n es unamuestra aleatoria de una distribution normal con media q, y varianza 
a 2 . La independencia de — E) 2 y Y se puede demostrar como sigue. Defina una matriz A de 

n x n con 


A = 


1 

1 

1 

1 

v« 

Vu~ 

\/n 

V/7 

1 

-1 

0 

0 

V2 

V2 

1 

1 

-2 

0 

V2Y3 

V2Y3 



1 

\/n 

0 


1 

\fn 

0 

0 


1 1 
- V(u — 1 )n y/(n — 1 )n 


1 ~(n ~ 1) 

V'(« — l)n V(n ~ l)n - 


y observe que A'A = I, la matriz identidad. Entonces 

Df=Y'Y = Y'A'AY, 

i=l 

donde Y es el vector de valores If 
a Demuestre que 

Ui 

AY = U 2 , 

. u '-i . 

donde U 1 , U 2 , ■ ■ ■, t/„_, son funciones lineales de Y l , Y 2 ,..., Y n . Entonces, 


±Y 2 =nf + fu 2 . 

i=l i=l 

b Demuestre que las funciones lineales Y \/n, U 1 , U 2 ,..., (/„_! son ortogonales por pares y por tanto 
independientes de acuerdo con la suposicion de normalidad. (Vease el Ejercicio 5.130.) 
c Demuestre que 

i>-y) 2 =xx 

i =1 i =1 

y concluya que esta cantidad es independiente de Y . 
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d Usando los resultados del inciso c, demuestre que 

E'' =l ( Yi-W = (n - 1)5 2 

a 2 a 2 

tiene una distribucion \ 2 con (« — 1) grados de libertad. 

*13.94 Considere un diseno de un factor con k tratamientos. Suponga que Y- es la y-esima respuesta para el 
tratamiento (poblacion) i y que esta distribuida normalmente con media /r, y varianza cr 2 , para i = 1, 
2 ,..., ky j *= 1 , 2, , n t . 

a Use el Ejercicio 13.93 para justificar que y 1; Y 2 , ■ ■ ■, Y k son independientes de SSE. 
b Demuestre que MST/MSE tiene una distribucion F con Vi = k — 1 y v 2 = n\ + n 2 + •" + 
n k — k grados de libertad dada H 0 : /jli — /x 2 = • ■ • = /u*. (Se puede suponer, para mayor senci- 
llez, que n l — n 2 = ■ ■ ■ = n k .) 
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Analisis de 
datos categoricos 

14.1 Descripcion del experimento 

14.2 Prueba ji cuadrada 

14.3 Prueba de una hipotesis con respecto a probabilidades especificadas por celda: 
una prueba de la bondad de ajuste 

14.4 Tablas de contingencia 

14.5 Tablas rxc con totales fijos de renglon o columna 

14.6 Otras aplicaciones 

14.7 Resumen y conclusiones 
Bibliograffa y lecturas adicionales 


14.1 Descripcion del experimento 

Numerosos experimentos resultan en mediciones que son cualitativas o categoricos mas que 
cuantitativas, como muchas de las mediciones estudiadas en capftulos previos. En estos ejem- 
plos una cualidad o caracterfstica es identificada por cada una de las unidades experimentales. 
Los datos asociados con esas mediciones se pueden resumir al dar la cuenta del numero de 
mediciones que caen en cada una de las distintas categories asociadas con la variable. Por 
ejemplo, 

• Los empleados pueden ser clasificados en uno de cinco grupos de ingreso. 

• Los ratones podrian reaccionar en una de tres formas cuando se someten a un estfmulo. 

• Los vehtculos a motor podrian caer en uno de cuatro tipos de vehtculos. 

• Las pinturas podrian ser clasificadas en una de k categories de acuerdo con su estilo y 
periodo. 

• La calidad de incisiones quirurgicas podrian ser mas identificadas en forma significativa 
como excelente, muy buena, buena, regular o mala. 

• Los artfculos manufacturados son aceptables, de segunda o rechazados. 

Con un grado razonable de aproximacion, todos los ejemplos precedentes muestran las 
siguientes caracterfsticas que definen un experimento multinomial (vea la Seccion 5.9): 
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1. El experimento consiste en n ensayos identicos. 

2. El resultado de cada ensayo cae en exactamente una de k categories o celdas distintas. 

3. La probabilidad de que el resultado de un solo ensayo caiga en una celda particular, la 
celda i, es p t , donde i = 1 , 2, ..., ky continua igual de un ensayo a otro. Observe que 

Pi + Pi + P3 d-+ Pk = E 

4. Los ensayos son independientes. 

5. Estamos interesados en n v n 2 , n 3 , ..., n k , donde n i para i = 1, 2 ,k es igual 
al numero de ensayos para los cuales el resultado cae en la celda i. Observe que 
n [ + «2 + «3 +•■• + «* = n. 


Este experimento es analogo a lanzar n pelotas en k cajas, donde cada pelota debe caer 
exactamente en una de las cajas. La probabilidad de que una pelota caiga en una caja varfa de 
una caja a otra pero sigue siendo la misma para cada caja en tiros repetidos. Por ultimo, las 
pelotas son lanzadas en forma tal que los ensayos son independientes. Al termino del expe¬ 
rimento, observamos pelotas en la primera caja, n 1 en la segunda,... y n k en la £-esima. El 
numero total de pelotas es n = n \ + n 2 + «3 + • ■ ■ + n^. 

Observe la similitud entre los experimentos binomial y multinomial y, en particular, que 
el experimento binomial representa el caso especial para el experimento multinomial cuando 
k = 2. Las probabilidades de dos celdas, p y q = 1 — p, del experimento binomial son sustitui- 
das por las probabilidades por celda k, p v p 2 , ..., p del experimento multinomial. El objetivo 
de este capftulo es hacer inferencias acerca de las probabilidades por celda p v p l7 ..., p k . Las 
inferencias se expresaran en terminos de pruebas estadfsticas de hipotesis que se refieran a 
valores numericos especfficos de las probabilidades por celda o a su relacion mutua. 

Debido a que el calculo de probabilidades multinomiales es un tanto engorroso, serfa diffcil 
calcular los niveles exactos de significancia (probabilidades de cometer errores tipo I) para las 
hipotesis que se refieren a los valores de p v p 2 ,..p k . Por fortuna, hemos sido aliviados de 
este trabajo por el estadfstico ingles Karl Pearson, quien propuso un estadfstico muy util para 
probar hipotesis con respecto a p v p 2 ,..., p k y proporciono la distribucion muestral aproxi- 
mada de este estadfstico. En la siguiente seccion haremos un resumen de la construccion del 
estadfstico de Pearson. 


14.2 Prueba ji cuadrada 

Suponga que n = 100 pelotas fueron lanzadas a las celdas (cajas) y que sabfamos que /; era 
igual a 0.1. ^Cuantas pelotas se esperarfa que cayeran en la celda 1? Volviendo a la Seccion 
5.9, recuerde que n, tiene una distribucion binomial (marginal) con parametros n y p v y que 


E(n i) = np i = (100)(.l) = 10. 


Del mismo modo, cada una de las n t tiene distribuciones binomiales con parametros n y p : y 
el numero esperado que caiga en la celda i es 


E(n,) = npi , 


i = 1 , 2 ,..., k. 
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Ahora suponga que proponemos valores para p t , p 2 ,..., p k y calculamos el valor esperado 
para cada celda. Ciertamente, si nuestra hipotesis es verdadera, los conteos n ; por celda no de- 

ben desviarse demasiado de sus valores esperados np t para i = 1,2. k. Por tanto, parecerfa 

intuitivamente razonable usar un estadfstico de prueba que comprenda las k desviaciones, 

nj — E(tij) = rii — npi, para i = 1,2,..., k. 


En 1900, Karl Pearson propuso el siguiente estadfstico de prueba, que es una funcion de los 
cuadrados de las desviaciones de las cantidades observadas respecto de sus valores esperados, 
ponderados por los reciprocos de sus valores esperados: 

x 2 = [«f ~ E(rij )] 2 _ [«,- - npi] 2 

pf E( n t ) f-( rip. 


Aunque la prueba matematica esta fuera del proposito de este texto, se puede demostrar que 
cuando n es grande, X 2 tiene una distribucion de probabilidad Ji cuadrada (x 2 ) aproximada. 
Podemos facilmente demostrar este resultado para el caso k = 2 de la siguiente manera. Si 
k = 2, entonces n 2 = n — n ] y p Y + p 2 = 1. Entonces, 


x 2 _ [W; - E(nj)] 2 _ (wi - np\) 2 + (n 2 ~ np 2 ) 2 


EOh ) 


np i 


np 2 


(»i ~ npi ) 2 [(« - «i) - n( 1 - pi)] 2 




«(1 - pi) 


(»t ~ "Pi ) 2 (“«l +«Pi ) 2 


«Pi 


= («1 - «/7l) - + 


«(1 - Pl) 
1 1 


npi n( \ ~ p\)) np i(1 Pi') 


(«i - npi ) 2 


Hemos visto (Section 7.5) que para n grande 


n i — np i 
V»pi(i - p\) 

tiene aproximadamente una distribucion normal estandar. Como el cuadrado de una variable 
aleatoria normal estandar tiene una distribucion \ 2 ( vea Ejemplo 6.11), para k = 2 y n grande, 
X 2 tiene una distribucion x 2 aproximada con 1 grado de libertad (gl). 

La experiencia ha demostrado que las cantidades n t en la celda no deben ser tan pequenas 
si la distribucion x~ debe proporcionar una aproximacion adecuada para la distribucion X 2 . 
Como regia practica, requeriremos que todas las cantidades esperadas por celda sean al menos 
cinco, aunque Cochran (1952) ha observado que este valor puede ser de solo uno para algunas 
situaciones. 

Usted recordara el uso de la distribucion de probabilidad x~ para probar una hipotesis 
respecto a una varianza poblacional cr 2 en la Seccion 10.9. En particular, hemos visto que la 
forma de la distribucion \ 2 y los cuantiles y areas de cola asociados difieren en forma consi¬ 
derable dependiendo del numero de grados de libertad (vea Tabla 6, Apendice 3). Por tanto, 
si deseamos usar X 2 como estadfstico de prueba, debemos conocer el numero de grados de 
libertad asociado con la distribucion x 2 de aproximacion y si hay que usar una prueba de una 
cola o de dos colas para localizar la region de rechazo para la prueba. Este ultimo problema 
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puede resolverse directamente. Como grandes diferencias entre las cantidades observadas y 
esperadas por celda contradicen la hipotesis nula, rechazaremos la hipotesis nula cuando X 2 
sea grande y emplearemos una prueba estadfstica de cola superior. 

La determination del numero apropiado de grados de libertad a emplearse para la prueba 
puede ser un poco complicada y, por tanto, sera especificada para las aplicaciones ffsicas 
descritas en las secciones siguientes. Ademas, expresaremos el principio involucrado (que es 
fundamental para la prueba matematica de la aproximacion) para que usted entienda por que 
el numero de grados de libertad cambia con varias aplicaciones. Este principio indica que el 
numero apropiado de grados de libertad sera igual al numero de celdas, k, memos 1 grado de 
libertad para cada restriccion lineal independiente colocada en las probabilidades por celda. 
Por ejemplo, una restriccion lineal esta siempre presente porque la suma de las probabilidades por 
celda debe ser igual a 1; esto es, 


Pi + pi + P3 +' ' ' + pk — 1 . 

Otras restricciones se introduciran para algunas aplicaciones por la necesidad de estimar para- 
metros desconocidos requeridos en los calculos de las frecuencias esperadas por celda, o por 
el metodo empleado para recolectar la muestra. Cuando deban estimarse parametros desco¬ 
nocidos para calcular X 2 , debe emplearse un estimador de maxima probabilidad (MLE). Los 
grados de libertad para la distribution x 2 de aproximacion se reduce en 1 para cada parametro 
estimado. Estos casos apareceran cuando consideremos varios ejemplos practicos. 


14.3 Prueba de una hipotesis con respecto 

a probabilidades especificadas por celda: 
una prueba de la bondad de ajuste 

La hipotesis mas sencilla respecto a probabilidades por celda es aquella que especifica valores 
numericos para cada una. En este caso, estamos probando // 0 : f>\ = P\,o, P2 = Pi,o,■■■, Pk = 
Pkfi, donde p t 0 denota un valor especificado para p r La hipotesis alternativa expresa, en gene¬ 
ral, que al menos una de las igualdades no se cumple. Como la unica restriccion en las proba¬ 
bilidades por celda es que Y^=i Pi = 1> e l estadfstico de prueba X 2 tiene aproximadamente 
una distribution x 2 con k — 1 grados de libertad. 


EJEMPLO 14.1 Un grupo de ratas, una por una, bajan por una rampa que conduce a tres puertas. Deseamos 
probar la hipotesis de que las ratas no tienen preferencia respecto a la election de una puerta. 
Entonces, la hipotesis nula apropiada es 


1 

H 0 : Pi = pi = P3 = 

donde p t es la probabilidad de que una rata escogera la puerta i, para i = 1, 2 o 3. 

Suponga que las ratas bajaron por la rampa n = 90 veces y que las tres frecuencias por 
celda observadas fueron n 1 = 23, n 2 = 36 y n 3 = 31. La frecuencia esperada por celda es igual 
para cada celda: £(«,•) = tip, = (90)( 1 /3) = 30. Las frecuencias por celda observada y espe- 
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Tabla 14.1 Cantidades por celda observadas y esperadas 



Puerta 

Valor 

1 2 3 

Frecuencia por celda observada 
Frecuencia por celda esperada 

/?! =23 «2 =36 /?3 = 31 

(30) (30) (30) 


rada se presentan en la Tabla 14.1. Observe la discrepancia entre las frecuencias observadas y 
esperadas por celda. ^Los datos presentan suficiente evidencia para justificar el rechazo de la 
hipotesis de no preferencia? 

Solucion El estadistico de prueba x 2 para nuestro ejemplo tendra (k — 1) = 2 grados de libertad porque 
la unica restriccion en las probabilidades por celda es que 


P\ + Pi + P3 = 1 . 

Por tanto, si escogemos a = .05, rechazarfamos la hipotesis nula cuando X 2 > 5.991 (vea la 
Tabla 6, Apendice 3). 

Sustituyendo en la formula para X 2 obtenemos 

x 2 _ [»f ~ £Qh)] 2 = («i ~npi) 2 

f~t £ ("/) hi np ‘ 

= (23 - 30) 2 + (36 - 30) 2 + (31 - 30) 2 = 

30 30 30 

Como X 2 es menor que el valor crftico tabulado de x 2 , la hipotesis nula no se rechaza y con- 
cluimos que los datos no presentan suficiente evidencia para indicar que las ratas tienen pre¬ 
ferencia por cualquiera de las puertas. En este caso, el valor p esta dado por valor p = P(x 2 > 
2.87), donde \ 2 posee una distribucion con A: — 1 = 2 grados de libertad. Usando la Tabla 
6, Apendice 3, se deduce que el valor p > 0.10. La aplicacion Chi-Square Probability and 
Quantiles da un valor p = P(x 2 > 2.87) = .23812. ■ 


El estadistico x 2 tambien se puede usar para probar si los datos muestrales indican que un 
modelo especifico para una distribucion poblacional no se ajusta a los datos. Un ejemplo de 
esa prueba, llamada prueba de bondad de ajuste, se ilustra en el siguiente ejemplo. 


EJ EMPLO 14.2 El numero de accidentes Y por semana en un crucero se verified por n = 50 semanas, con los 

resultados que se muestran en la Tabla 14.2. Pruebe la hipotesis de que la variable aleatoria Y 
tiene una distribucion de Poisson, suponiendo que las observaciones son independientes. Use 
a = .05. 

Solucion La hipotesis nula H 0 expresa que Y tiene la distribucion de Poisson dada por 

, \ y e~ x 

piy A) =-—, y =0,1,2,.... 

y'- 
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Tabla 14.2 

Datos para el Ejemplo 14.2 

y 

Frecuencia 

0 

32 

l 

12 

2 

6 

3 o mas 

0 


Como A es desconocida, debemos hallar su estimador de maxima probabilidad (MLE). En el 
Ejercicio 9.80 establecimos que el MLE de A es A = Y. Para los datos dados, A tiene el valor 
y = 24/50 = .48. 

Tenemos, para los datos dados, tres celdas con cinco o mas observaciones: las celdas defi- 
nidas por Y = 0, Y = I y K > 2. Dada H 0 , las probabilidades para estas celdas son 

pi = P(Y = 0) = e~ A , p 2 = P(Y = 1) = Ae~ A , 


p 3 = P(Y > 2) = 1 - e _A - Ae~ A . 

Estas probabilidades se calculan al sustituir A con A, que da como resultado 

pi = e ”' 48 = .619, p 2 = .48e~' 48 = .297, p 3 = 1 - p x - p 2 = .084. 

Si las observaciones son independientes, las frecuencias por celda n 1; n 2 y « 3 tienen una 
distribucion multinomial con parametros p u p 2 y p 3 . Entonces, £’(«,) = up, y las frecuencias 
por celda esperadas y estimadas estan dadas por 

E(ni) = rtpi = 30.95, £(« 2 ) = np2 = 14.85, E(n 3 ) = np 3 = 4.20. 

Entonces, el estadfstico de prueba esta dado por 

^2 _ \- n i ~ E(rii)]~ 

~ hi Wi) 


que tiene aproximadamente una distribucion \ 2 con (k — 2) = 1 grado de libertad. (Un grado 
de libertad se pierde porque A tenia que calcularse, el otro, porque P‘ = !•) 

Al calcular X 2 encontramos 


2 _ (32 - 30.95) 2 i (12-14.85) 2 l (6-4.20) 2 
30.95 14.85 A20 


1.354. 


Como x]) 2 = 3.841, con 1 grado de libertad, no rechazamos H 0 . Los datos no presentan sufi- 
ciente evidencia para contradecir nuestra hipotesis de que Y posee una distribucion de Poisson. 
El valor p esta dado por P(x : > 1.354). La Tabla 6, Apendice 3, da el valor p > . 10 mientras que 
la aplicacion Chi-Square Probability and Quantiles establece que el valor p = .24458. A menos 
que se utilice un valor muy grande de (a > .24458), no hay suficiente evidencia para rechazar la 
afirmacion de que el numero de accidentes por semana tiene una distribucion de Poisson. ■ 


Ejercicios 

14.1 Historicamente, las proporciones de todas las personas de origen caucasico en Estados Unidos con 
fenotipos sangumeos A, B, AB y O son .41, .10, .04 y .45, respectivamente. Para determinar si las 
proporciones actuales de poblacion todavla se comparan con estos valores historicos, se selecciono 
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una muestra aleatoria de 200 estadounidenses caucasicos y se registraron sus fenotipos sangufneos. Los 
numeros observados con cada fenotipo se dan en la siguiente tabla. 

A B AB O 
89 18 12 81 


a i,Hay suficiente evidencia, en el nivel de significancia .05 para alirmar que las proporciones actuales 
difieren de los valores historicos? 

b Ejercicio Applet Use la aplicacion Chi-Square Probability and Quantiles para hallar el valor p aso- 
ciado con la prueba del inciso a. 

14.2 Registros previos de inscripciones en una gran universidad indican que del numero total de personas 
que solicitan admision, 60% son admitidos incondicionalmente, 5% son admitidos condicionalmente y 
el resto son rechazados. De 500 solicitantes para el ano siguiente, 329 fueron admitidos incondicional¬ 
mente, 43 fueron admitidos condicionalmente y el resto no fueron admitidos. ^Estos datos indican una 
desviacion de los porcentajes previos de admision? 

a Pruebe usando a = .05. 

b Ejercicio Applet Use la aplicacion Chi-Square Probability and Quantiles para hallar el valor p aso- 
ciado con la prueba del inciso a. 

14.3 Una via rapida en una ciudad, con cuatro carriles en cada direccion, fue estudiada para ver si los con- 
ductores prefieren viajar en los carriles interiores. Se observaron un total de 1000 automoviles durante 
el intenso transito de la hora pico por la manana y se registraron sus carriles respectivos. Los resultados 
se muestran en la siguiente tabla. ^Los datos presentan suficiente evidencia para indicar que algunos 
carriles se prefieren a otros? (Pruebe la hipotesis de que p x = p 2 = p 3 = p 4 = 1/4, usando a = .05.) 
Proporcione lfmites para el valor p asociado. 


Carril 

1 

2 

3 

4 

Cantidad 

294 

276 

238 

192 


14.4 ^Odia usted los lunes? Investigadores en Alemania han dado otra razon para hacerlo: concluyeron que el 
riesgo de ataque al corazon en un lunes, para una persona que trabaja, puede ser hasta 50% mayor que 
en cualquier otro dfa. 1 Los investigadores registraron ataques al corazon y paros cardiacos en un periodo 
de 5 anos entre 330 000 personas que vivfan cerca de Augsberg, Alemania. En un intento por verificar lo 
dicho por el investigador, se encuestaron 200 trabajadores que habian tenido ataques al corazon recien- 
temente. El dfa en el que ocurrieron sus ataques al corazon aparecen en la tabla siguiente. 


Domingo 

Lunes 

Martes 

Miercoles 

Jueves 

Viernes 

Sabado 

24 

36 

27 

26 

32 

26 

29 


^Estos datos presentan suficiente evidencia para indicar que hay una diferencia en los porcentajes de 
ataques al corazon que ocurren en diferentes dfas de la semana? Pruebe usando a = .05. 

14.5 Despues de inspeccionar los datos del Ejercicio 14.4, quiza le gustarfa probar la hipotesis de que la 
probabilidad de que una persona sufra un ataque al corazon en lunes es 1/7 contra la alternativa de que 
esta probabilidad sea mayor que 1/7. 


1. Fuente: Daniel Q. Haney, “Mondays May Be Hazardous,” Press-Enterprise (Riverside, Calif.), 17 de noviembre 
de 1992, p. A16. 
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14.6 


14.7 


14.8 


14.9 


14.10 


14.11 


a Realice la prueba anterior usando a — .05. 

b r,Que principio de una buena practica estadfstica se viola en la prueba del inciso a? 
c Antes de ver los datos actuales, ^hay una razon que por la cual usted padrfa considerar legftimamente 
las hipotesis del inciso a? 

Imagine que las suposiciones asociadas con un experimento multinomial estan todas satisfechas. 
Entonces (vea la Seccion 5.9) cada una de las i = 1,2 k, tienen una distribucion binomial con 
parametros n y p ; . Ademas, Cov («,., = ~np-pj si i A j. 

a ^Cual es E (n t — nj)l 

b Consulte el inciso a. Proporcione un estimador insesgado para p t — pj . 
c Demuestre que V(n,- — tij) = «[/>,(1 —/>,•) + Pj{ 1 — pj) + 2 p,p f \. 

d Consulte el inciso c. ^Cual es la varianza del estimador insesgado que se dio en el inciso b? 
e Proporcione un estimador consistente para n~ l V(n i — nj). 

f Si n es grande, el estimador que se dio en el inciso b esta distribuido normalmente en forma aproxi- 
mada con media p t — pj y varianza n~ 2 V(n i — nj). Si pi = n,/n y pj = rij/n, demuestre que un 
intervalo de confianza (1 — cr) 100% con muestra grande para p t — pj esta dado por 

, , IPii 1 ~ Pi) + PM ~ Pi) +2 PiPj 

Pi - pj± Za/2-J -■ 

V n 

Consulte el Ejercicio 14.3. El carril 1 es para vehlculos “lentos” y el carril 4 es para vehlculos “rapidos”. 
Use la formula de intervalo de confianza dada en el Ejercicio 14.6(f) para dar un intervalo de confianza 
de 95% para /), — p 4 . ^Se concluirfa que una mayor proporcion viaja en el carril lento que en el carril 
rapido? ^Por que? 

La teorfa de Mendel dice que el numero de un tipo de chfcharos que cae en las clasificaciones redonda 
y amarilla, arrugada y amarilla, redonda y verde, y arrugada y verde debe estar en la proporcion 9:3:3:1. 
Suponga que 100 de estos chfcharos revelaron 56, 19, 17 y 8 en las respectivas categorfas. ^Estos datos 
son consistentes con el modelo? Use a = .05. (La expresion 9:3:3:1 significa que 9/16 de los chfcharos 
deben ser redondos y amarillos, 3/16 deben ser arrugados y amarillos, etc.) 

Consulte el Ejercicio 14.6(f) y los datos del Ejercicio 14.8. 

a Proporcione un intervalo de confianza de 95% para la diferencia en las proporciones de chfcharos 
redondos amarillos y redondos verdes. 

b Construya, usando el metodo Bonferroni estudiado en la Seccion 13.12, intervalos simultaneos de 
confianza para comparer la proporcion de chfcharos redondos amarillos con las proporciones de chf¬ 
charos en cada una de las otras tres categorfas. Los intervalos han de tener coeficiente simultaneo de 
confianza de al menos .95. 

Dos tipos de defectos, A y B, se ven con frecuencia a la salida de un proceso de manufacture. Cada 
artfculo puede ser clasificado en una de las cuatro clases: A Cl B, A ClB, A (IB y A C\B, donde A denota 
la ausencia del defecto tipo A. Para 100 artfculos inspeccionados, se observaron las siguientes frecuen- 
cias: 

A nB : 48, A C\~B : 18, A 05:21, A 05 : 13. 

^Hay suficiente evidencia para indicar que las cuatro categorfas, en el orden citado, no se presentan en 
la proporcion 5:2:2:1? (Use a = .05.) 

Los datos de la tabla siguiente son los conteos de frecuencia para 400 observaciones del numero de 
colonias bacterianas dentro del campo de un microscopio, usando muestras de pelfcula de leche. 2 r,Hay 
suficiente evidencia para decir que los datos no se ajustan a la distribucion de Poisson? (Use a — .05.) 


2. Fuente: C. A. Bliss y R. A. Fisher. "Fitting the Negative Binomial Distribution to Biological Data,” Biometrics 
9 (1953): 176-200. Biometrics Society. Todos los derechos reservados. 
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Numero de colonias 
por campo 

Frecuencia de 
observacion 

0 

56 

1 

104 

2 

80 

3 

62 

4 

42 

5 

27 

6 

9 

7 

9 

8 

5 

9 

3 

10 

2 

11 

0 

19 

1 


400 


14.12 Durante un periodo fijo se observo el numero de accidentes sufridos por mecanicos, con los resultados 
que se ven en la siguiente tabla. 3 Pruebe, con un nivel de significancia de 5%, la hipotesis de que los 
datos provienen de una distribution de Poisson. 


Accidentes por 
mecanico 

Frecuencia de observacion 
(numero de mecanicos) 

0 

296 

1 

74 

2 

26 

3 

8 

4 

4 

5 

4 

6 

1 

7 

0 

8 

1 


14.4 Tablas de contingencia 

Un problema frecuente en el analisis de conteo de datos se refiere a la evaluation de la inde- 
pendencia de dos metodos para la clasificacion de sujetos (personas). Por ejemplo, podriamos 
clasificar una muestra de personas por genero y por opinion acerca de un problema politico, 
para probar la hipotesis de que las opiniones sobre el problema son independientes del genero. 
Del mismo modo, podriamos clasificar pacientes que sufren de una enfermedad de acuerdo 
con el tipo de medicamento y su rapidez de recuperation, para ver si esta depende del tipo de 
medicamento. En cada uno de estos ejemplos deseamos investigar la dependencia (o contin¬ 
gencia) entre dos criterios de clasificacion. 

Suponga que deseamos clasificar defectos hallados en muebles producidos en una planta 
manufacturera de acuerdo con (1) el tipo del defecto y (2) el turno de produccion. Se registro 


3. Fuente: C. A. Bliss y R. A. Fisher, “Fitting the Negative Binomial Distribution to Biological Data,” Biometrics 9 
(1953): 176-200. Biometrics Society. Todos los derechos reservados. 
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Tabla 14.3 Tabla de contingencia 


Turno 


Tipo de defecto 


Total 

A 

B 

C 

D 

1 

15 (22.51) 

21 (20.99) 

45 (38.94) 

13 (11.56) 

94 

2 

26 (22.99) 

31 (21.44) 

34 (39.77) 

5 (11.81) 

96 

3 

33 (28.50) 

17 (26.57) 

49 (49.29) 

20 (14.63) 

119 

Total 

74 

69 

128 

38 

309 


un total de n = 309 defectos en muebles y los defectos se clasificaron como uno de cuatro 
tipos, A, B, C o D. A1 mismo tiempo, cada mueble fue identificado de acuerdo con el turno 
de produccion durante el cual fue manufacturado. Estas cantidades se presentan en la Tabla 
14.3, ejemplo de tabla de contingencia. (Como veremos mas adelante, los numeros dentro de 
parentesis son las frecuencias esperadas y estimadas por celda.) Nuestro objetivo es probar la 
hipotesis nula de que el tipo de defecto es independiente del turno contra la alternativa de que 
los dos esquemas de clasificacion son dependientes. Esto es, deseamos probar //„: clasifica¬ 
cion de columna es independiente de clasificacion de renglon. 

Sea p A igual a la probabilidad incondicional de que un defecto sea del tipo A. De manera 
similar, defina p B , p c y p n como las probabilidades de observar los otros tres tipos de defectos. 
Entonces estas probabilidades, a las que llamaremos probabilidades de columna de la Tabla 
14.3, satisfacen el requisito de que 

Pa + Pb + Pc + Pd = 1. 

Del mismo modo, sea para i = 1, 2 o 3 igual a las probabilidades de renglon de que una 
pieza defectuosa se produzca en el turno i, donde 

Pi + P2 + Ps= 1 ■ 

Si las dos clasificaciones son independientes entre si, cada probabilidad por celda es igual al 
producto de sus respectivas probabilidades de renglon y columna. Por ejemplo, la probabili¬ 
dad de que un defecto se presente en el turno 1 y sea del tipo A es p l x p A . Observamos que 
los valores numericos de las probabilidades por celda no estan especificados en el problema 
en consideracion. La hipotesis nula solo especifica que cada probabilidad por celda es igual al 
producto de sus respectivas probabilidades de renglon y columna y, por tanto, implica inde¬ 
pendence de las dos clasificaciones. 

El analisis de los datos obtenidos de una tabla de contingencia difiere del analisis del 
Ejemplo 14.1, porque debemos estimar las probabilidades de renglon y columna para estimar 
las frecuencias por celda esperadas. Las frecuencias por celda esperadas y estimadas pueden 
ser sustituidas por la E(n : ) en X 2 , y X 2 continuara teniendo una distribucion que esta bien 
calculada por una distribucion de probabilidad x 2 - 

El estimador de maxima probabilidad (MLE) para cualquier probabilidad de renglon o 
columna se encuentra como sigue. Con n l} denotemos la frecuencia observada en el renglon 
i y la columna j de la tabla de contingencia y con p t] denotemos la probabilidad de que una 
observacion caiga en esta celda. Si las observaciones se seleccionan de manera independiente, 
entonces las frecuencias por celda tienen una distribucion multinomial y el MLE de p tj es 
simplemente la frecuencia relativa observada para esa celda. Esto es, 

Pij = t = 1, 2 , ..., r, j = 1, 2 ,... , c 


(vease el Ejercicio 9.87). 
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Del mismo modo, viendo el renglon i como una sola celda, la probabilidad para el renglon 
; esta dada por p t , y si r f denota el numcrn de observaciones en el renglon i, 

n 

Pi = ~ 
n 

es el MLE de p t . 

Por argumentos semejantes, el MLE de la probabilidad de la /-esima columna es Cj/n, don- 
de Cj denota el numero de observaciones en la columna j. 

Dada la hipotesis nula, el MLE del valor esperado de n n es 

EXnhi) = n(p i X p A ) = n (-) (-) = 

De manera analoga, si la hipotesis nula es verdadera, el valor esperado y estimado de la fre- 
cuencia por celda, n tj para una tabla de contingencia es igual al producto de sus respectivos 
totales de renglon y columna divididos entre el tamano muestral total. Esto es. 


E(n u ) 


r iC 


j 


n 


Las frecuencias esperadas y estimadas por celda para nuestro ejemplo se muestran entre pa- 
rentesis en la Tabla 14.3. Por ejemplo. 


E{n n ) 


r\C\ 

n 


94(74) 

309 


22.51. 


Ahora podemos usar las frecuencias esperadas y observadas por celda que se muestran en 
la Tabla 14.3 para calcular el valor del estadistico de prueba 

yi _ \. n ij ~ E(nij))- 

E&ij) 

_ (15 - 22.51) 2 ^ (26 - 22.99) 2 
22.51 22.99 

= 19.17. 

El unico obstaculo restante comprende la determinacion del numero apropiado de grados 
de libertad asociado con el estadistico de prueba. Daremos este como regia, que mas adelante 
justificamos. Los grados de libertad asociados con una tabla de contingencia que tenga r ren- 
glones y c columnas siempre sera igual a (r — l)(c — 1). Para nuestro ejemplo, comparamos 
X 2 con el valor critico de x 2 con (r — l)(c — 1) = (3 — 1)(4 — 1) = 6 grados de libertad. 

Usted recordara que el numero de grados de libertad asociado con el estadistico \ 2 ser ^ 
igual al numero de celdas (en este caso, k= r x c) menos 1 grado de libertad por cada restric- 
cion lineal independiente colocada en las probabilidades por celda. El numero total de celdas 
para los datos de la Tabla 14.3 es k= 12. De esta cantidad restamos 1 grado de libertad porque 
la suma de las probabilidades por celda debe ser igual a 1; esto es, 

P 11 + P12 5 -+ P34 = 1 - 

Ademas, usamos las frecuencias por celda para estimar dos de las tres probabilidades de ren¬ 
glon. Observe que la estimacion de la probabilidad del tercer renglon se determina una vez 


(20 - 14.63) 2 
14.63 
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que hayamos estimado p ] y p 2 , porque 

Pi + P 2 + Pi = !■ 

Entonces, perdemos 3—1=2 grados de libertad para estimar las probabilidades de renglon. 

Por ultimo, usamos las frecuencias de las celdas para estimar (c — 1) = 3 probabilidades 
de columna y por tanto perdemos (c — 1) = 3 grados de libertad adicionales. El numero total de 
grados de libertad restante es 

gl = 12 — 1—2 — 3=6 = (3 — 1)(4 - 1). 

En general vemos que el numero total de grados de libertad asociado con una tabla de contin- 
gencia de r x c es 


gl = rc — 1 — (r — 1) — (c — 1) = (r — l)(c — 1). 

Por tanto, en nuestro ejemplo que relaciona el turno con el tipo de defecto del mueble, si 
usamos a = .05, rechazaremos la hipotesis nula de que las dos clasificaciones son indepen- 
dientes si X 2 > 12.592. Como el valor del estadlstico de prueba, X 2 = 19.17, excede al valor 
crftico de x 2 , rechazamos la hipotesis nula en el nivel de significance a = .05. El valor p 
asociado esta dado por valor p = P(x 2 > 19.17). Los lhnites de esta probabilidad se pueden 
obtener usando la Tabla 6, Apendice 3, de la cual se deduce que valor p < .005. La aplicacion 
Chi-Square Probability and Quantiles da el valor p exacto = .00389. En consecuencia, para 
cualquier valor de a mayor o igual a .00389, los datos presentan suficiente evidencia para indi¬ 
car dependencia entre el tipo de defecto y el turno de manufactura. Es probable que un estudio 
de las operaciones de produccion para los tres turnos permita descubrir la causa. 


EJEMPLO 14.3 Se realizo un estudio para evaluar la efectividad de una nueva vacuna para la gripe que te¬ 
nia que ser administrada en una pequena comunidad. La vacuna era gratuita para quienes la 
solicitaran, en una secuencia de dos inyecciones durante un periodo de 2 semanas; algunas 
personas recibieron esa secuencia, pero otras se presentaron solo para la primera y los demas 
no recibieron ninguna. 

Un estudio de 1000 habitantes de la localidad arrojo en la primavera siguiente la infor¬ 
mation que se indica en la Tabla 14.4. ^Los datos presentan suficiente evidencia para indicar 
una dependencia entre las dos clasificaciones, es decir, categorla de vacuna y aparicion o no 
aparicion de la gripe? 

Solution La pregunta investiga si los datos aportan suficiente evidencia para indicar dependencia entre 
categorla de vacuna y aparicion o no aparicion de la gripe. Por tanto, analizamos los datos 
como una tabla de contingencia. 


Tabla 14.4 Tabulacion de datos para el Ejemplo 14.3 


Condition 

Sin vacuna 

Una vacuna 

Dos vacunas 

Total 

Gripe 

24 (14.4) 

9 (5.0) 

13 (26.6) 

46 

Sin gripe 

289 (298.6) 

100 (104.0) 

565 (551.4) 

954 

Total 

313 

109 

578 

1000 
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Las frecuencias esperadas y estimadas por celda pueden calcularse con el uso de los totales 
apropiados de renglon y columna. 


Asi, por ejemplo, 


-—- r/Cj 

E(ijj) = ±-L. 

n 


E(n n ) 

_ DCi 

(46X313) 

= 14.4, 

n 

1000 

(2 

_ f\C2 

(46)( 109) 

= 5.0. 

n 

1000 


Estas y las frecuencias esperadas y estimadas por celda restantes se muestran entre parentesis 
en la Tabla 14.4. 

El valor del estadistico de prueba X 2 se calcula y compara ahora con el valor crftico de \ 2 
que posee (r — l)(c — 1) = (1)(2) = 2 grados de libertad. Entonces, para a = .05, rechazare- 
mos la hipotesis nula cuando X 2 > 5.991. Sustituyendo en la formula para X 2 , obtenemos 

v2 _ (24 - 14.4) 2 l (289 — 298.6) 2 ± | (565 -551.4) 2 

144 298.6 + 551.4 

= 17.35. 

Observe que si X 2 cae en la region de rechazo, entonces rechazamos la hipotesis nula de inde- 
pendencia de las dos clasificaciones. Si elegimos usar el metodo de nivel de significancia al- 
canzado para hacer nuestra inferencia, el uso de la Tabla 6, Apendice 3, establece que el valor 
p < .005. La aplicacion x~ da un valor p = .00017. En este caso, como siempre, encontramos 
un acuerdo entre nuestro metodo de nivel a fijado para probar y la interpretation apropiada 
del valor p. ■ 


Como se establecio en la Section 5.9, las n- estan correlacionadas negativamente. Por 
ejemplo, Cov(n 7/ , n kl ) = ~np lj p kj si i A k o j A /. Una adaptation del resultado dado en el 
Ejercicio 14.7(f) se puede usar para asignar un intervalo de confianza con muestra grande para 
Pij ~ Pki s ' dicho intervalo tiene un valor interpretativo practico. Del mismo modo, las pro- 
porciones marginales se pueden comparar si se “colapsa” la tabla de contingencia a solo las 
observaciones marginales de renglon o columna. El resultado del Ejercicio 14.6 (f) se aplica 
directamente a la tabla colapsada. No obstante, estas tablas marginales “colapsadas” sacrifican 
cualquier informacion acerca de la dependencia entre las variables de renglon y columna. 

Hemos considerado solo la hipotesis mas sencilla conectada con una tabla de contingencia, 
la de independencia entre renglones y columnas. Muchas otras hipotesis son posibles y nume- 
rosas tecnicas se han ideado para probarlas. Para mas informacion sobre este tema, consulte la 
obra de Agresti (2002) y Fienberg (1980). 


Ejercicios 

14.13 En el aniversario 40 del asesinato del presidente John F. Kennedy, una encuesta del noticiero FOX 
mostro que casi todos los estadounidenses estan en desacuerdo con las conclusiones del gobiemo acerca 
de ese crimen. La Comision Warren encontro que Lee Harvey Oswald actuo solo cuando le disparo a 








726 Capftulo14 


Analisis de datos categoricos 


Kennedy, pero muchos estadounidenses no estan seguros de esta conclusion. ^Piensa usted que sabemos 
todos los hechos relevantes asociados con el asesinato de Kennedy o piensa que se ha ocultado informa¬ 
tion? La siguiente tabla contiene los resultados de una encuesta nacional de 900 votantes registrados. 4 


Conocemos todos 

los datos relevantes 

Se ocultan algunos 
datos relevantes 

No esta 
seguro 

Democrata 

42 

309 

31 

Republicano 

64 

246 

46 

Otro 

20 

115 

27 


a ^Los datos dan suficiente evidencia para indicar una dependencia entre afiliacion de un partido y la 
opinion acerca de un posible encubrimiento? Pruebe usando a = .05. 
b Fije llmites para el valor p asociado e interprete el resultado. 
c Ejercicio Applet Use la aplicacion x~ para obtener el valor p aproximado. 
d ^Por que es “aproximado” el valor que obtuvo en el inciso c? 

14.14 Joseph Jacobson y Diane Wille realizaron un estudio para determinar el efecto del cuidado temprano 
de ninos con patrones de apego entre hijo y madre. 5 En el estudio, 93 infantes fueron clasificados como 
“seguro” o “ansioso” usando el paradigma Ainsworth de situation extrana. Ademas, los infantes fueron 
clasificados de acuerdo con el numero promedio de horas por semana que recibfan cuidado. Los datos 
aparecen en la siguiente tabla. 




Horas en cuidados de infantes 

Patron de 

Bajo 

Moderado 

Alto 

afecto 

(0-3 horas) 

(4-19 horas) 

(20-54 horas) 

Seguro 

24 

35 

5 

Ansioso 

11 

10 

8 


a ^Los datos indican dependencia entre patrones de apego y el numero de horas de atencion al nino? 
Pruebe usando a = .05. 

b Establezca llmites para el nivel de significancia alcanzado. 

14.15 Suponga que las entradas en una tabla de contingencia que aparecen en el renglon i y la columna j estan 
denotadas por para i = 1, 2,..., r yj = 1,2,..., c; que los totales de renglon y columna estan deno- 
tados por r p para i = 1 , 2, ..., r, y Cp para j = 1 , 2, ..., c; y que el tamano muestral total es n. 

a Demuestre que 

* 2 = E E k =»fc E — - 1 V 

j= 1 <■= 1 \j= 1 ;=1 r i c i ) 

Observe que esta formula proporciona una forma mas eficiente desde el punto de vista computatio¬ 
nal para calcular el valor de X 2 . 

b Usando la formula anterior, ^que le ocurre al valor de X 2 si toda entrada en la tabla de contingencia 
se multiplica por la misma constante entera k > 0? 

14.16 Una encuesta para explorar la relation entre los patrones de asistencia a la iglesia de votantes y sus 
elecciones de candidato presidential se publico en Riverside Press-Enterprise antes de la election de 


4. Fuente: adaptado de Dana Blanton, "Poll: Most Believe ‘Cover-up’ of JFK Assassination Facts,” http://www. 
foxnews.com/story/0,2933,102511,00.html, 10 de febrero de 2004. 

5. Fuente: Linda Schmittroth (ed.) Statistical Record of Women Worldwide (Detroit and London: Gale Research, 
1991), pp. 8,9, 335. 
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2004. A los votantes se les pregunto con que frecuencia asistfan a la iglesia y por cual de los dos candi¬ 
dates presidenciales (George W. Bush o John Kerry) iban a votar en la eleccion. Los resultados de una 
encuesta similar estan contenidos en la siguiente tabla. 6 


Asistencia a la iglesia 

Bush 

Kerry 

Mas de una vez por semana 

89 

53 

Una vez por semana 

87 

68 

Una o dos veces al mes 

93 

85 

Una o dos veces al ano 

114 

134 

Rara vez/nunca 

22 

36 


a (,Hay evidencia suficiente para indicar dependencia entre la frecuencia de asistencia a la iglesia y la 
eleccion del candidato en la eleccion presidencial de 2004? Pruebe con un nivel de significancia de 
.05. Ponga llmites al nivel de significancia alcanzado. 
b Fije un intervalo de confianza de 95% para la proporcion de personas que informan haber asistido a 
la iglesia al menos una vez por semana. 

14.17 En el mundo academico es frecuente que estudiantes y asesores de profesores colaboren en publica- 
ciones de investigacion, produciendo obras en las que el credito de la publication puede tomar varias 
formas. Muchos piensan que la primera autorfa de un ensayo tecnico de un estudiante debe darsele a 
este, a menos que la participation del asesor sea muy importante. En un intento por ver si de hecho este 
es el caso, se estudio el credito de autorfa para diferentes grados de aportacion del asesor y dos objetivos 
(disertaciones contra investigacion sin tftulo academico). La frecuencia de decisiones de asignacion de 
autorfa para disertaciones publicadas se da en las siguientes tablas, tal como fueron asignadas por 60 
miembros del profesorado y 161 estudiantes: 7 


Profesores participantes 


Asignacion de autorfa 

Entrada elevada 

Entrada media 

Entrada baja 

Asesor como primer autor, estudiante 

4 

0 

0 

como segundo autor (obligatorio) 
Estudiante como primer autor, asesor 

15 

12 

3 

como segundo autor (obligatorio) 
Estudiante como primer autor, asesor 

2 

7 

7 

como segundo autor (cortesfa) 
Estudiante como unico autor 

2 

3 

5 

Estudiantes participantes 

Asignacion de autorfa 

Entrada elevada 

Entrada media 

Entrada baja 

Asesor como primer autor, estudiante 

19 

6 

2 

como segundo autor (obligatorio) 
Estudiante como primer autor, asesor 

19 

41 

27 

como segundo autor (obligatorio) 
Estudiante como primer autor, asesor 

3 

7 

31 

como segundo autor (cortesfa) 
Estudiante como unico autor 

0 

3 

3 


6. Fuente : Adaptado de Bettye Wells Miller, “Faith Shows Ballot Clout,” Press-Enterprise (Riverside, Calif.), 1 de 
marzo de 2004, p. A7. 

7. Fuente : M. Martin Costa y M. Gatz, “Determination of Authorship Credit in Publisher Dissertations,” Psycholo¬ 
gical Science 3(6) (1992): 54. 
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14.18 


14.19 


14.20 

14.21 


a i,Hay suficiente evidencia para indicar una dependencia entre la asignacion de autoria y la entrada del 
asesor, segun lo consideren los miembros del profesorado? Pruebe usando a = .01. 
b i,Hay suficiente evidencia para indicar una dependencia entre la asignacion de autoria y la entrada del 
asesor, segun lo consideren los estudiantes? Pruebe usando a = .01. 
c ^Han sido violadas algunas de las suposiciones necesarias para un analisis valido en los incisos a y 
b? ^Que efecto podrfa tener esto en la validez de sus conclusiones? 

Un estudio de la cantidad de violencia en television en lo que respecta a la edad del televidente dio los 
resultados que se muestran en la siguiente tabla, para 81 personas. (Cada una de las personas del estudio 
fue clasificada, de acuerdo con los habitos de ver TV de la persona, como que ve poca violencia o mucha 
violencia.) ^Los datos indican que ver violencia no depende de la edad del televidente con un nivel de 
significancia de 5%? 


Edad 

Ve 16-34 

35-54 

55 y mas 

Poca violencia 8 

12 

21 

Mucha violencia 18 

15 

7 


Los resultados de un estudio 8 sugieren que el electrocardiograma (ECG) inicial de una vfctima que se 
sospecha sufre un ataque al corazon se pueden usar para predecir complicaciones de naturaleza aguda en 
el hospital. El estudio incluyo 469 pacientes con sospecha de infarto al miocardio (ataque al corazon). 
Cada uno de los pacientes fue clasificado de acuerdo con si su ECG inicial era positivo o negativo y si 
la persona sufrfa complicaciones que ponlan en riesgo su vida despues en el hospital. Los resultados se 
resumen en la siguiente tabla. 



Complicaciones que ponen en riesgo la vida 
del intemado en hospital 


ECG 

No 

SI 

Total 

Negativo 

166 

1 

167 

Positivo 

260 

42 

302 

Total 

426 

43 

469 


a ^Hay suficiente evidencia para indicar que si el paciente de un ataque al corazon sufre o no compli¬ 
caciones depende del resultado del ECG inicial? Pruebe usando a — .05. 
b Establezca llmites para el nivel de significancia alcanzado. 

Consulte el Ejercicio 14.10. Pruebe la hipotesis, con un nivel de significancia de 5%, que los defectos 
del tipo A se presentan independientemente de los defectos tipo B. 

Un uso interesante y practico de la prueba x 2 ocurre al probar la segregation de especies de plantas o 
animales. Suponga que dos especies de plantas, A y B, estan creciendo en un lote de prueba. Para evaluar 
si las especies tienden a segregarse, un investigador muestrea al azar n plantas del lote; se registran la 
especie de cada planta muestreada y la especie de su vecina mas cercana. Los datos se anotan luego en 
una tabla, como se ilustra aquf. 


8. Fuente: J. E. Brush y otros, “Use of the Initial Electrocardiogram to Predict In-Hospital Complications of Acute 
Myocardial Infarction,” New England Journal of Medicine (mayo de 1985). 
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Vecina mas 

cercana 

Planta muestreada A 

B 

A a 

b 

B c 

d 

n 


Si a y d son grandes con respecto a b y c, estarfamos inclinados a decir que las especies tienden a segre- 
garse. (Casi todas las vecinas de las A son del tipo A, y casi todas las vecinas de las B son del tipo B.) Si 
bye son grandes en comparacion con ay d, dirfamos que las especies tienden a estar demasiado revuel- 
tas. En cualquiera de estos casos (segregacion o demasiado revueltas), una prueba \ 2 debe dar un valor 
grande y la hipotesis de mezcla aleatoria se rechazarfa. Para cada uno de los casos siguientes, pruebe la 
hipotesis de mezcla aleatoria (o bien, de manera equivalente, la hipotesis que afirma que la especie de 
una planta es independiente de la especie de su vecina mas cercana). Use a = .05 en cada caso. 

a a — 20, b = 4, c = 8, d — 18. 
b a =4, b =20, c = 18, = 8. 
c a = 20, b = 4, c = 18, d = 8. 

14.5 Tablas r x c con totales fijos de 
renglon o columna 

En la seccion anterior, describimos el analisis de una tabla de contingencia r x c mediante el 
uso de ejemplos que, para todos los fines practicos, se ajusta al experimento multinomial des- 
crito en la Seccion 14.1. Aunque los metodos para recolectar datos en muchos estudios pueden 
satisfacer los requisitos de un experimento multinomial, otros metodos no los satisfacen. Por 
ejemplo, podrfamos no querer muestrear aleatoriamente la poblacion descrita en el Ejemplo 
14.3 porque podrfamos hallar que, debido a la casualidad, faltarfa una categorfa completa. Las 
personas que no han recibido inyecciones de vacuna contra la gripe podrfan no aparecer en 
la muestra. Podrfamos decidir de antemano entrevistar a un numero especificado de personas 
de cada categorfa de columna, con lo cual se fijan anticipadamente los totales de columna. 
Entonces tendrfamos tres experimentos binomiales separados e independientes, correspon- 
dientes a “no vacuna”, “una vacuna” y “dos vacunas”, con probabilidades respectivas de p t , 
p 2 y p 3 de que una persona contraiga la gripe. En este caso, estamos interesados en probar la 
hipotesis nula 

H o ■ Pi = Pi = Pi- 

(En realidad estamos probando la equivalencia de tres distribuciones binomiales.) De acuerdo 
con esta hipotesis, los MLE de las frecuencias esperadas por celda son los mismos que en la 
Seccion 14.4, es decir. 


E(n u ) 


ncj_ 

n 


(■.Cuantos grados de libertad estan asociados con la distribution de aproximacion x 2 ‘- Hay r c 
probabilidades en total. Como los totales de columna son fijos, la suma de las probabilidades 
en cada columna debe ser igual a uno. Esto es, 

P\j+ Plj + •■■ Prj = 1 , 


para cada j = 1,2,... c. 
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y hay c restricciones lineales en las p :j , que resultan en una perdida de c grados de libertad. 
Finalmente, es necesario estimar r— 1 probabilidades de renglon (las probabilidades estima- 
das de renglon deben sumar 1), disminuyendo los grados de libertad en una r— 1 adicional. 
Asf, el numero de grados de libertad asociados con X 2 calculado para una tabla r x c con 
totales fijos de columna es gl = rc — c — (r — 1) = (r — l)(c — 1). 

Para ilustrar, suponga que deseamos probar una hipotesis respecto a la equivalencia de 
cuatro poblaciones binomiales, como se indica en el siguiente ejemplo. 


EJEMPLO 14.4 Una encuesta de las opiniones de los votantes se realizo en cuatro distritos politicos urbanos 
para comparar la fraction de votantes que estan a favor del candidato A. Muestras aleatorias 
de 200 votantes fueron entrevistados en cada uno de los cuatro distritos, con los resultados 
que se muestran en la Tabla 14.5. <',Los datos presentan suficiente evidencia para indicar que 
las fracciones de votantes a favor del candidato A difieren en los cuatro distritos? 

Solution Observara que la mecanica para probar las hipotesis respecto a la equivalencia de los parame- 
tros de las cuatro poblaciones binomiales, que corresponden a los cuatro distritos, es identica 
a la mecanica asociada con probar la hipotesis de independencia de las clasificaciones de 
renglon y columna. Si denotamos la fraction de votantes a favor de A como p y planteamos 
la hipotesis de que p es igual para los cuatro distritos, implicamos que las probabilidades del 
primer renglon son todas iguales a p y que las probabilidades del segundo renglon son todas 
iguales a 1 — p. El MLE (que combina los resultados de las cuatro muestras) para el valor 
comun de p es p = 236/800 = r\ /n. El numero esperado de personas que estan a favor de A 
en el distrito 1 es E(n n ) = 200 p, que es estimado por el valor 

- / 236 \ (cm) 

S( Bll )= 200/>= 200 (-) = ^. 

Observe que aun cuando estamos analizado un experimento muy diferente al considerado 
en la Section 14.4, las frecuencias medias estimadas por celda se calculan del mismo modo 
que en la Section 14.4. Las otras frecuencias por celda esperadas y estimadas, calculadas con 
el uso de los totales de renglon y columna, aparecen en la Tabla 14.5. Vemos que 


X 2 


y^ y^ [ n U E( n ij)\ 

hk Ei^j) 

(76 -59) 2 ± (124-141) 2 ± | (152 — 141) 2 

59 144 ' + 144 


10.72. 


Tabla 14.5 Tabulacion de datos para el Ejemplo 14.4 



Distrito 



Opinion 1 

2 

3 

4 

Total 

A favor de A 76 (59) 

53 (59) 

59 (59) 

48 (59) 

236 

No a favor de A 124(141) 

147 (141) 

141 (141) 

152(141) 

564 

Total 200 

200 

200 

200 

800 
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El valor crftico de x 2 para a = .05 y (r — l)(c — 1) = (1)(3) = 3 grados de libertad es 
7.815. Como X 1 excede este valor crftico, rechazamos la hipotesis nula y concluimos que la 
fraccion de votantes a favor del candidato A no es igual para todos los distritos. El valor p 
asociado esta dado por P(x 2 > 10.72) cuando x 2 tiene 3 grados de libertad. Asf, .01 < valor 
p < .025. La aplicacion x" da P(x 2 > 10.72) = .01334. ■ 


Este ejemplo fue resuelto en el Ejercicio 10.106 por el metodo de razon de probabilidades. 
Observe que las conclusiones son las mismas. 

La prueba realizada en el Ejemplo 14.4 es una prueba de la igualdad de cuatro proporcio- 
nes binomiales con base en muestras independientes a partir de cada una de las poblaciones 
correspondientes. Es frecuente que esta prueba se denomine prueba de homogeneidad de las 
poblaciones binomiales. Si hay mas de dos categorfas de renglon y los totales de columna 
son fijos, la prueba x 2 es una prueba de la equivalencia de las proporciones en c poblaciones 
multinomiales. 


Ejercicios 

14.22 Un estudio para determinar la efectividad de un medicamento (suero) para el tratamiento de la artritis 
resulto en la comparacion de dos grupos, cada uno de ellos formado por 200 pacientes artrfticos. Un gru- 
po fue inoculado con el suero mientras que el otro recibio un placebo (inoculacion que parece contener 
suero pero que en realidad no es activo). Despues de un tiempo, a cada persona del estudio se le pregunto si 
su condicion artrftica habfa mejorado; se observaron los siguientes resultados. ^Estos datos presentan 
suficiente evidencia para indicar que diferfan las proporciones de personas artnticas que dijeron que 
habfan mejorado, dependiendo de si habfan recibido el suero? 


Condicion 

Tratado 

No tratado 

Mejor 

117 

74 

No mejor 

83 

126 


a Pruebe usando el estadfstico X 2 . Use a = .05. 

b Pruebe usando la prueba Z de la Seccion 10.3 y a = .05. Compare su resultado con el del inciso a. 
c Establezca lfmites para el nivel de significancia alcanzado con la prueba del inciso a. 

14.23 La prueba x 2 usada en el Ejercicio 14.22 es equivalente a la prueba Z de dos colas de la Seccion 10.3, 
siempre que a sea la misma para las dos pruebas. Demuestre algebraicamente que el estadfstico X 2 de 
la prueba x 2 es el cuadrado del estadfstico de la prueba Z para la prueba correspondiente. 

14.24 ^En que forma los estadounidenses de la “generacion sandwich” equilibran las demandas de atencion 
para familiares mas viejos y mas jovenes? La siguiente tabla contiene los resultados de una encuesta por 
telefono de estadounidenses entre 45 y 55 anos llevada a cabo por The New York Times. 9 De cada una 
de cuatro subpoblaciones se encuestaron 200 personas y se les pregunto si daban apoyo financiero a sus 
padres. 


9. Fuente : adaptado de Tamar Lewin, “Report Looks at a Generation, and Caring for Young and Old,” New York 
Times en lfnea, 11 de julio de 2001. 
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Subpoblacion 



Apoyo 

Estadounidenses 

blancos 

Afroamericanos 

Hispano- 

americanos 

Asiaticoamericanos 

Sf 

40 

56 

68 

84 

No 

160 

144 

132 

116 


a Use la prueba \ 2 para determinar si las proporciones de personas que dan apoyo financiero a sus 
padres difiere para las cuatro subpoblaciones. Use a = .05. 
b Como las muestras son independientes, los intervalos de confianza para comparar las proporciones 
de cada subpoblacion que apoya financieramente a sus padres se pueden obtener usando el metodo 
presentado en la Seccion 8.6. 

i Establezca un intervalo de confianza de 95% para la diferencia en las proporciones que dan apoyo 
a sus padres para estadounidenses blancos y asiaticos. 

ii Use el metodo Bonferroni presentado en la Seccion 13.12 para dar seis intervalos simultaneos 
de confianza con el fin de comparar las proporciones que dan apoyo a sus padres para todos los 
pares de subpoblaciones. El objetivo es dar intervalos con coeficiente simultaneo de confianza de 
al menos .95. 

iii Con base en su respuesta al inciso ii, ^cuales son las subpoblaciones que difieren de las otras con 
respecto a la proportion de las que dan apoyo financiero a sus padres? 

14.25 ^La education hace realmente la diferencia respecto a cuanto dinero se gana? Unos investigadores se- 
leccionaron aleatoriamente a 100 personas de cada una de tres categorfas de ingresos: “marginalmente 
ricos”, “comodamente ricos” y “superricos”, y registraron sus niveles de education. Los datos se resu- 
men en la siguiente tabla. 10 


Nivel de 

education maximo 

Marginalmente Comodamente 

rico rico Superrico 

Sin universidad 

32 

20 

23 

Algunos estudios universitarios 

13 

16 

1 

Estudiante sin graduar 

43 

51 

60 

Estudios de posgrado 

12 

13 

16 

Total 

100 

100 

100 


a Describa las poblaciones multinomiales independientes cuyas proporciones estan comparadas en el 
analisis x 2 - 

b ^Los datos indican que las proporciones de los diversos niveles de education difieren para las tres 
categorfas de ingresos? Pruebe en el nivel a = .01. 

c Construya un intervalo de confianza de 95% para la diferencia en proporciones con al menos un estu- 
diante sin graduar para personas que son marginalmente ricos y superricos. Interprete el intervalo. 

14.26 Un fabricante de botones deseaba determinar si la fraction de botones defectuosos producidos por tres 
maquinas variaba de una maquina a otra. Se seleccionaron muestras de 400 botones de cada una de las 
tres maquinas y se conto el numero de defectuosos por cada muestra. Los resultados se observan en 
la siguiente tabla. ^Estos datos presentan suficiente evidencia para indicar que la fraction de botones 
defectuosos variaba de una maquina a otra? 


10. Fuente: adaptado de Rebecca Piirto Heath. "Life on Easy Street ’’American Demographics, abril de 1997, p. 33. 
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Maquina 

Numero de botones 

numero 

defectuosos 

i 

16 

2 

24 

3 

9 


a Pruebe, usando a — .05, con una prueba x 2 - 

*b Pruebe, usando a = .05, con una prueba de razon de probabilidades. [Sugerencia: consulte el 
Ejercicio 10.106.] 11 

14.27 H. W. Menard 12 realizo una investigation respecto a nodulos de manganeso, aglomeracion rica en mine- 
rales que se encuentra en abundancia en el lecho marino a gran profundidad. En una parte de su informe, 
Menard proporciono datos relacionados con la edad magnetica de la corteza terrestre y “la probabilidad 
de hallar nodulos de manganeso”. Los datos mostrados en la siguiente tabla representan el numero de 
muestras del nucleo de la tierra, asf como el porcentaje de las que contenfan nodulos de manganeso para 
cada una de varias edades magneticas de la corteza terrestre. ^Los datos arrojan suficiente evidencia 
para indicar que la probabilidad de hallar nodulos de manganeso en la corteza difiere dependiendo de la 
clasificacion de la edad magnetica? Pruebe con a = .05. 


Edad 

Numero de 

muestras 

Porcentaje con 
nodulos 

Mioceno, reciente 

389 

5.9 

Oligoceno 

140 

17.9 

Eoceno 

214 

16.4 

Paleoceno 

84 

21.4 

Cretacico tardfo 

247 

21.1 

Cretacico temprano y medio 

1120 

14.2 

Jurasico 

99 

11.0 


14.28 Tradicionalmente, los sindicatos de trabajadores en Estados Unidos han estado satisfechos con dejar 
la administration de empresas a gerentes y ejecutivos corporativos. En Europa, la participation de los 
trabajadores en la toma de decisiones administrativas es una idea aceptada que se hace cada vez mas 
popular. Para estudiar el efecto de la participation de los trabajadores, se entrevisto a 100 trabajadores 
en cada una de dos plantas manufactureras alemanas. Una planta tenia participation activa de trabaja¬ 
dores en la toma de decisiones gerenciales, no asf la otra. A cada trabajador seleccionado se le pregunto 
si aprobaba las decisiones gerenciales tomadas dentro de la planta. Los resultados aparecen a continua¬ 
tion. 



Participation 

Sin participation 

Generalmente aprueban 

73 

51 

No aprueban 

27 

49 


a ^Los datos indican una diferencia en las proporciones de trabajadores de las dos plantas que gene- 
ralmente aprueban las decisiones gerenciales? Pruebe con un nivel de significancia de .05 usando la 
prueba x 2 - 

b Construya un lfmite inferior de confianza de 95% para la diferencia en la proportion de trabajadores 
que aprueban decisiones gerenciales en las plantas con y sin su participation. 

11. Los ejercicios precedidos por un asterisco son opcionales. 

12. Fuente : H. W. Menard, “Time, Chance and the Origin of Manganese Nodules ” American Scientist, septiembre- 
octubre de 1976. ©1976 Scientific Research Company of North America. Todos los derechos reservados. 











734 


Capftulo 14 Analisis de datos categoricos 


^E1 fi'mite de confianza resultante indica que una mayor proportion de trabajadores aprueba decisio- 
nes gerenciales en la planta con su participacion activa? ^Por que? 
c ^La conclusion a la que se llego en el inciso b podrfa haber resultado de la prueba y 2 realizada en el 
inciso a? ^Por que? 

14.29 Se realizo una inspeccion para estudiar la relation entre enfermedades pulmonares y la contaminacion 
del aire. Se escogieron cuatro lugares para la inspeccion, dos ciudades que con frecuencia sufren de con¬ 
taminacion por el esmog y dos ciudades no urbanas en estados con bajos indices de contaminacion del 
aire. Se incluyeron solo adultos residentes permanentes de los lugares del estudio. Muestras aleatorias 
de 400 adultos residentes permanentes de cada uno de los lugares dieron los resultados que aparecen en 
la siguiente tabla. 


Area 

Numero de 

enfermedades pulmonares 

Ciudad A 

34 

Ciudad B 

42 

Zona no urbana 1 

21 

Zona no urbana 2 

18 


a ^Los datos aportan suficiente evidencia para indicar una diferencia en las proporciones con enferme¬ 
dades pulmonares para los cuatro lugares? 

b ^Los fumadores debieron excluirse de las muestras? ^Como afectarfa esto a las inferencias obtenidas 
de los datos? 

Consulte el Ejercicio 14.29. Calcule la diferencia en las fracciones de residentes permanentes adultos 
con enfermedades pulmonares para las ciudades A y B. Use un intervalo de confianza de 95%. 

Se realizo un estudio para investigar el interes de adultos de edad mediana en los programas de acondi- 
cionamiento flsico en Rhode Island, Colorado, California y Florida. El objetivo de la investigation era 
determinar si la participacion de adultos en programas de acondicionamiento flsico varra de una region 
de Estados Unidos a otra. Muestras aleatorias de personas fueron entrevistadas en cada estado y se re- 
gistraron los datos obtenidos en la siguiente tabla. ^Los datos indican diferencias entre los porcentajes 
de participacion de adultos en estos programas de un estado a otro? ^Que se concluirfa con a = .01? 


Participacion 

Rhode Island 

Colorado 

California 

Florida 

SI 

46 

63 

108 

121 

No 

149 

178 

192 

179 


14.6 Otras aplicaciones 

Las aplicaciones de la prueba y~ para el analisis de datos categoricos descritos en las Secciones 
14.3-14.5 representan solo algunos de los interesantes problemas de clasificacion que pueden 
calcularse mediante el experimento multinomial y para el cual nuestro metodo de analisis es 
apropiado. Por lo general estas aplicaciones son complicadas en mayor o menor grado porque 
los valores numericos de las probabilidades por celda no estan especificados y, por tanto, 
requieren la estimation de uno o mas parametros poblacionales. Entonces, al igual que en las 
Secciones 14.4 y 14.5, podemos calcular las probabilidades por celda. Aun cuando omitimos 


14.30 

14.31 
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la mecanica de las pruebas estadfsticas, varias aplicaciones adicionales de la prueba \ 2 mere- 
cen citarse como tema de interes. 

Por ejemplo, suponga que deseamos probar una hipotesis que afirma que una poblacion 
posee una distribucion normal de probabilidad. Las celdas de un histograma de frecuencia 
muestral corresponderfan a las k celdas del experimento multinomial y las frecuencias obser- 
vadas por celda serfan el numero de mediciones que caen en cada celda del histograma. Dada 
la hipotetica distribucion de probabilidad normal para la poblacion, podriamos usar las areas 
bajo la curva normal para calcular las probabilidades teoricas por celda y en consecuencia las 
frecuencias esperadas por celda. Los MLE deben emplearse cuando /r. y cr no esten especifica- 
dos para la poblacion normal y estos parametros deben calcularse para estimar probabilidades 
por celda. 

La construccion de una tabla de dos direcciones para investigar la dependencia entre dos 
clasificaciones se puede ampliar a tres o mas clasificaciones. Por ejemplo, si deseamos probar 
la independencia rnutua de tres clasificaciones, emplearfamos una “tabla” de tres dimensio- 
nes. El razonamiento y metodologfa asociados con el analisis de tablas de dos y tres entradas 
son identicos aun cuando el analisis de la tabla de tres entradas sea un poco mas complejo. 

Una tercera e interesante aplicacion de nuestra metodologfa serfa su uso en la investigation 
de la rapidez de cambio de una poblacion multinomial (o binomial) como funcion del tiempo. 
Por ejemplo, podriamos estudiar la capacidad para resolver el problema que tenga una perso¬ 
na (o cualquier animal) sometida a un programa educacional y examinada en el tiempo. Si, 
por ejemplo, la persona es examinada a intervalos prescritos y el examen es del tipo sf o no, 
dando varias respuestas correctas y que seguirfan una distribucion binomial de probabilidad, 
estarfamos interesados en el comportamiento de la probabilidad de una respuesta correcta p 
como funcion del tiempo. Si el numero de respuestas correctas se registro para c periodos, los 
datos caerfan en una tabla de 2 x c semejante a la del Ejemplo 14.4 (Section 14.5). Entonces 
estarfamos interesados en probar la hipotesis de que p es igual a una constante, es decir, que 
no ha ocurrido aprendizaje y entonces plantearfamos hipotesis mas interesantes para deter- 
minar si los datos presentan suficiente evidencia para indicar un cambio gradual (lineal, por 
ejemplo) en el tiempo, en oposicion a un cambio abrupto en algun punto en el tiempo. Los 
procedimientos que hemos descrito podrfan ampliarse a decisiones que comprendan mas de 
dos alternativas. 

Usted observara que nuestro ejemplo de cambio en el tiempo es comun en las finanzas, la 
industria y en muchos otros campos de actividad, incluyendo las ciencias sociales. Por ejem¬ 
plo, podriamos desear estudiar el porcentaje de aceptacion de los consumidores de un produc- 
to nuevo para varios tipos de campanas publicitarias como funcion del tiempo que la campaiia 
haya estado en vigor. O podriamos estudiar la tendencia de la fraction de un lote de piezas 
defectuosas en un proceso de manufactura como funcion del tiempo. Estos dos ejemplos, asf 
como muchos otros, requieren un estudio del comportamiento de un proceso binomial (o mul¬ 
tinomial) como funcion del tiempo. 

Los ejemplos que acabamos de describir tienen la intention de sugerir la aplicacion relati- 
vamente amplia del analisis x~ de datos categoricos, un hecho que debe ser recordado por el 
experimentador que se ocupe de este tipo de datos. Es frecuente que la prueba estadfstica que 
utilice X 2 como estadfstico de prueba sea denominada prueba de bondad de ajuste. Su aplica¬ 
cion para algunos de los ejemplos requiere cuidado en la determination de las estimaciones 
apropiadas y el numero de grados de libertad para X 2 , que en algunos de estos problemas 
puede resultar muy complicado. 
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14.7 Resumen y conclusiones 

El material de este capftulo se ha referido a pruebas de hipotesis relacionadas con proba- 
bilidades por celda asociadas con experimentos multinomiales (Secciones 14.2 y 14.3) o 
con varios experimentos multinomiales independientes (Seccion 14.5). Cuando el numero de 
observaciones n es grande, se puede demostrar que el estadfstico de prueba X 2 posee, aproxi- 
madamente, una distribution de probabilidad \ 2 en muestreo repetido, el numero de grados 
de libertad dependera de la aplicacion particular. En general, suponemos que n es grande y 
que la frecuencia minima esperada por celda es igual o mayor que cinco. 

Unas palabras de advertencia respecto al uso del estadfstico X 2 como metodo para anali- 
zar datos categoricos. La determination del numero correcto de grados de libertad asociados 
con el estadfstico X 2 es crftica para localizar la region de rechazo. Si el numero se especifica 
incorrectamente, podrfan resultar conclusiones erroneas. Observe tambien que el no rechazo 
de la hipotesis nula no implica que deba ser aceptada. Tendrfamos dificultad para expresar 
una hipotesis alternativa significativa para muchas aplicaciones practicas y, por tanto, nos 
faltarfa conocimiento de la probabilidad de cometer un error tipo II. Por ejemplo, expresamos 
la hipotesis de que dos clasificaciones de una tabla de contingencia son independientes. Una 
alternativa especifica debe determinar una medida de dependencia que puede o no poseer sig- 
nificancia practica para el experimentador. Por ultimo, si faltan parametros y deben estimarse 
las frecuencias esperadas por celda, los parametros faltantes deben calcularse por el metodo 
de maxima probabilidad para que la prueba sea valida. En otras palabras, el empleo de la prue¬ 
ba x 2 P ara otras aplicaciones que no sean las indicadas en las Secciones 14.3-14.5 requerira 
de una experiencia que esta fuera del proposito de esta presentation introductoria del tema. 
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Ejercicios complementarios 

14.32 Mencione las caracterfsticas de un experimento multinomial. 

14.33 Se llevo a cabo un estudio para determinar las actitudes de estudiantes, profesores y empleados adminis- 
trativos acerca de una nueva polftica de estacionamientos en una universidad. La distribution de quienes 
estan a favor o se oponen a esa polftica se muestran en la siguiente tabla. ^.Los datos dan suficiente 
evidencia para indicar que las actitudes respecto a la polftica de estacionamiento son independientes de 
la condicion de estudiante, profesor o empleado de administracion? 


Opinion 

Estudiante 

Profesor 

Administracion 

A favor 

252 

107 

43 

Se opone 

139 

81 

40 


14.34 ^Como se califica usted como automovilista? De acuerdo con un estudio llevado a cabo por el Field 
Institute, 13 la mayorfa de los californianos piensan que son buenos conductores pero que tienen poco 
respeto por la capacidad de conducir de otros. Los datos de las tablas siguientes muestran la distribucion 
de opiniones, segun el genero, para dos preguntas diferentes. Los datos de la primera tabla proporcionan 
los resultados obtenidos cuando los conductores se califican a si mismos; la segunda tabla muestra los 
resultados obtenidos cuando los conductores calificaron a otros. Aun cuando no se cita en la fuente, 
suponemos que hubo 100 hombres y 100 mujeres en cada uno de los grupos estudiados. 


Opinion de sf mismo como conductor 

Genero 

Excelente Bueno 

Regular 

Hombre 

43 48 

9 

Mujer 

44 53 

3 


Opinion de otros conductores 

Genero 

Excelente Bueno Regular Malo 

Hombre 

Mujer 

4 42 41 13 

3 48 35 14 


a Consulte la tabla en la que los conductores se califican a sf mismos. ^Hay suficiente evidencia para 
indicar que hay una diferencia en las proporciones de las tres categorfas de calificacion para automo- 
vilistas hombres y mujeres? Establezca lfmites para el valor p asociado con la prueba. 
b Consulte la tabla en la que los conductores califican a otros. f,Hay suficiente evidencia para indicar 
que hay una diferencia en las proporciones de las cuatro categorfas de calificacion cuando califican 
a automovilistas hombres y mujeres? Establezca lfmites para el valor p asociado con la prueba. 
c ^Violo usted alguna de las suposiciones en sus analisis en los incisos a y b? f,Que efecto podrfan tener 
estas violaciones sobre la validez de las conclusiones? 

13. Fuente'. Dan Smith, '“Motorists Have Little Respect for Others’ Skills,” Press-Enterprise (Riverside, Calif.) 15 
de marzo de 1991. 
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14.35 ^La probabilidad de “pescar” un resfriado esta influenciada por el numero de contactos sociales que 
tiene una persona? Un estudio de Sheldon Cohen, profesor de psicologla de la Universidad Carnegie 
Melon, parece demostrar que cuantas mas relaciones sociales tenga una persona, es rnenos susceptible a 
resfriados. Un grupo de 276 hombres y mujeres sanos se agruparon de acuerdo con su numero de rela¬ 
ciones (por ejemplo como padre, amigo, miembro de la iglesia, vecino). A continuation se expusieron a 
un virus causante del resfriado. En la tabla siguiente se da una adaptation de los resultados. 14 



Numero de relaciones 


3 o menos 

4 o 5 

6 o mas 

Resfriado 

49 

43 

34 

No resfriado 

31 

57 

62 

Total 

80 

100 

96 


a ^Los datos presentan suficiente evidencia para indicar que la susceptibilidad a resfriados es afectada 
por el numero de relaciones que tienen las personas? Pruebe con un nivel de significance de 5%. 
b Establezca lifnites para el valor p. 

14.36 Las lesiones en las rodillas pueden ser un problema importante para los atletas en muchos deportes de 
contacto. No obstante, aquellos atletas que juegan ciertas posiciones son mas propensos a lesiones en las 
rodillas que otros jugadores. La prevalencia y las formas de lesiones en rodillas entre jugadoras colegia- 
les de rugby fueron investigadas por medio de un sencillo cuestionario, al cual respondieron 42 clubes 
de rugby. 15 Un total de 76 lesiones en las rodillas se clasifico por tipo y position (delantero o defensa) 
del jugador lesionado. 



Desgarre 

Desgarre Desgarre 


Position 

de meniscos 

MCL 

ACL 

Otras 

Delantero 

13 

14 

7 

4 

Defensa 

12 

9 

14 

3 


a ^Los datos dan suficiente evidencia para indicar dependencia entre la position jugada y el tipo de 
lesiones en las rodillas? Pruebe usando a = .05. 
b De lfmites para el valor p asociado con el valor para X 2 obtenido en el inciso a. 
c Ejercicio Applet Use la aplicacion Chi-Square Probability and Quantiles para determinar el valor p 
asociado con el valor de X 2 obtenido en el inciso a. 

14.37 Con frecuencia no queda claro si todas las propiedades de un experimento binomial se satisfacen en 
realidad en una aplicacion determinada; una prueba de bondad de ajuste es deseable para estos casos. 
Suponga que un experimento formado por cuatro ensayos se repite 100 veces. El numero de repeticiones 
en las que se obtuvo un numero dado de exitos se registra en la siguiente tabla. Estime p (suponiendo 
que el experimento haya sido binomial), obtenga estimaciones de las frecuencias esperadas por celda y 


14. Fuente: adaptado de David L. Wheeler, “More Social Roles Means Fewer Colds,” Chronicle of Higher Education 
43(44) (1997): A13. 

15. Fuente'. Andrew S. Levy, M. J. Wetzler, M. Lewars, and W. Laughlin, "Knee Injuries in Women Collegiate Rugby 
Players,” American Journal of Sports Medicine 25(3) (1997): 360. 
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pruebe la bondad de ajuste. Para determinar el numero apropiado de grados de libertad para X 2 , observe 
que p tuvo que ser estimada. 


Posibles resultados 
(numero de exitos) 

Numero de veces 
que se obtuvo 

0 

11 

1 

17 

2 

42 

3 

21 

4 

9 


14.38 El conteo del numero de artfculos por conjunto (colonia o grupo) debe ser necesariamente mayor o igual 
a 1. Asf, la distribution de Poisson generalmente no se ajusta a estas clases de conteos. Para modelar 
conteos sobre fenomenos como son el numero de bacterias por colonia, el numero de personas por fami- 
lia, asf como el numero de animales por camada, es frecuente que la distribution de la serie logaritmica 
resulte util. Esta distribution discreta tiene funcion de probabilidad dada por 

P(y |fl) = - , ,/ y = 1, 2, 3,..., 0 < 0 < 1, 

ln(l - 8) y 

donde 9 es un parametro desconocido. 
a Demuestre que el MLE 0 de 9 satisface la ecuacion 

a _ j n 

Y = -^-—, donde Y = - Y' Y t . 

-(l-fl)ln(l ~9) nj-( 

b Los datos de la siguiente tabla representan frecuencias observadas sobre el numero de bacterias por 
colonia, para cierto tipo de bacterias del suelo. 16 


Bacterias por colonia 

1 234567+ 

Numero de colonias observado 

359 146 57 41 26 17 29 


Pruebe la hipotesis de que estos datos se ajustan a una distribution de serie logaritmica. Use a = .05. 
(Observe que el valor y debe ser aproximado porque no tenemos information exacta en recuentos 
mayores que seis. ) 

14.39 Consulte la tabla de contingencia r x c de la Section 14.4. Demuestre que el MLE de la probabilidad p ; 
para el renglon i es p ; = r ; /n, para i— 1,2 r. 

*14.40 Un modelo genetico expresa que las proporciones de descendientes en tres clases debe serp 2 , 2p(l — p) 
y (1 — p) 2 para un parametro p, 0 £ p £ 1. Un experimento arrojo frecuencias de 30, 40 y 30 para las 
clases respectivas. 

a ^,E1 modelo se ajusta a los datos? (Use maxima probabilidad para estimarp.) 

b Suponga que la hipotesis expresa que el modelo se cumple con p = .5. ^Los datos contradicen esta 
hipotesis? 

*14.41 De acuerdo con el modelo genetico para la relation entre sexo y ceguera a los colores, las cuatro cate¬ 
gories, macho y normal, hernbra y normal, macho y ciego al color, hembra y ciego al color, deben tener 


16. Fuente : C. A. Bliss and R. A. Fisher. "Fitting the Negative Binomial Distribution to Biological Data,” Biometrics 
9 (1953): 176-200. Biometrics Society. Todos los derechos reservados. 
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probabilidades dadas porp/2, (p 2 / 2) + pq, q/ 2 y cp /2 respectivamente, donde q = 1«- p. Una muestra 
de 2000 personas revelo 880, 1032, 80 y 8 en las categories respectivas. ^Estos datos concuerdan con el 
modelo? Use a = .05. (Use maxima probabilidad para estimar p.) 

*14.42 Suponga que (Y v Y 2 , ..., Y k ) tiene una distribucion multinomial con parametros n, p 1; p 2 , ..., p k y 
(Xj, X 2 ,..., X k ) tiene una distribucion multinomial con parametros m, p\, p 2 ,..., p* k . Construya una 
prueba de la hipotesis nula de que las dos distribuciones multinomiales son identicas; esto es, pruebe 

Ho ■ Pi = P\, Pi = Pi, ■ ■ ■, Pk = Pi- 

*14.43 En un experimento para evaluar un insecticida se esperaba que la probabilidad de que sobrevivan in- 
sectos fuera lineal con respecto a la dosis D en la region de experimentacion; esto es, p = 1 + (3D. Se 
realizo un experimento usando cuatro niveles de dosis, 1, 2, 3 y 4, y 1000 insectos en cada grupo. Los 
datos resultantes se muestran en la tabla siguiente. ^Estos datos contradicen la hipotesis de que p = 1 + 
/3£>? [ Sugerencia : escriba las probabilidades por celda en terminos de f} y encuentre el MLE de /3.] 



Numero de 

Dosis 

sobrevivientes 

1 

820 

2 

650 

3 

310 

4 

50 
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Estadfstica no parametrica 

15.1 Introduccion 

15.2 Modelo general de desplazamiento (o cambio) de dos muestras 

15.3 Prueba de signos para un experimento de observaciones pareadas 

15.4 Prueba de rangos con signo de Wilcoxon para un experimento de observaciones pareadas 

15.5 Uso de rangos para comparar dos distribuciones poblacionales: muestras aleatorias 
independientes 

15.6 Prueba U de Mann-Whitney: muestras aleatorias independientes 

15.7 La prueba de Kruskal-Wallis para un diseiio de un factor 

15.8 La prueba de Friedman para disenos de bloques aleatorizados 

15.9 Prueba de corridas de ensayo: una prueba de aleatoriedad 

15.10 Coeficiente de correlacion de rangos 

15.11 Comentarios generales sobre las pruebas estadfsticas no parametricas 
Bibliograffa y lecturas adicionales 


15.1 Introduccion 

Algunos experimentos dan como resultado medidas de respuesta que desaffan una cuantifica- 
cion exacta. Por ejemplo, suponga que se le pide a un juez evaluar y clasificar la capacidad de 
instruccion de cuatro profesores, o las caracterfsticas comestibles y de sabor de cinco marcas 
de hojuelas de mafz. Debido a que es claramente imposible dar una medida exacta de la com- 
petencia de un profesor o el sabor de un alimento, las mediciones de respuesta son de un 
caracter completamente diferente a las presentadas en los capftulos anteriores. En ejemplos 
como estos, los experimentos generan mediciones de respuesta que se pueden ordenar (clasi¬ 
ficar), pero es imposible hacer enunciados tales como “el profesor A es el doble de bueno que 
el profesor B“, Aunque experimentos de este tipo se presentan en casi todos los campos de 
actividad, son particularmente evidentes en la investigation en ciencias sociales y en estudios 
de preferencias de consumidores. Los metodos estadfsticos no parametricos son utiles para 
analizar este tipo de datos. 
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Los procedimientos estadisticos no parametricos se aplican no solo a observaciones que 
son dificiles de cuantificar, sino que tambien son particularmente utiles para hacer inferencias 
en situaciones en las que existe una seria duda acerca de las suposiciones que son la base de 
la metodologia estandar. Por ejemplo, la prueba t para comparar un par de medias basadas en 
muestras independientes, Seccion 10.8, esta basada en la suposicion de que ambas poblacio- 
nes estan distribuidas normalmente con varianzas iguales. El experimentador nunca sabra si 
estas suposiciones se cumplen en una situation practica, pero con frecuencia estara razonable- 
mente seguro de que las desviaciones de las suposiciones seran lo suficientemente pequenas 
para que las propiedades del procedimiento estadistico no se alteren. Esto es, a y /3 seran mas 
o menos lo que el experimentador piensa que son. Por otra parte, no es raro que el experi¬ 
mentador dude de la validez de una suposicion y se pregunte si esta usando un procedimiento 
estadistico valido. A veces esta dificultad se puede salvar si se usa una prueba de estadistico 
no parametrico, con lo cual se evita usar un procedimiento estadistico que sea apropiado solo 
para un conjunto muy incierto de suposiciones. 

El termino estadistico no parametrico no tiene definition estandar que haya sido acor- 
dada por todos los expertos en estadistica, pero casi todos concuerdan en que los metodos 
estadisticos no parametricos funcionan bien con suposiciones bastante generates acerca de 
la naturaleza de cualesquiera distribuciones de probabilidad o parametros que intervienen 
en un problema inferencial. Como tesis de trabajo, definiremos metodos parametricos como 
aquellos que se aplican a problemas donde la(s) distribucion(es) de la(s) cual(es) se toman las 
muestras estan especificadas excepto para los valores de un niimero finito de parametros. Los 
metodos no parametricos se aplican en todos los otros casos. Por ejemplo, la prueba 1 de una 
muestra desarrollada en el Capitulo 10 se aplica cuando la poblacion esta distribuida normal¬ 
mente con media y varianza desconocidas. Debido a que la distribucion de la cual se toma la 
muestra esta especificada excepto para los valores de dos parametros, p y a 2 , la prueba t es 
un procedimiento parametrico. En forma alternativa, suponga que muestras independientes 
se toman de dos poblaciones y que deseamos probar la hipotesis de que dos distribuciones 
poblacionales son identicas pero de forma no especificada. En este caso, la distribucion es no 
especificada y la hipotesis debe ser probada con el uso de metodos no parametricos. 

El empleo valido de algunos de los metodos parametricos presentados en capitulos anterio- 
res exige que se satisfagan al menos aproximadamente ciertas suposiciones de distribucion. 
Incluso si se satisfacen todas las suposiciones, la investigation ha demostrado que las prue- 
bas estadisticas no parametricas son casi tan capaces de detectar diferencias entre poblaciones 
como los metodos parametricos aplicables. Pueden ser, y con frecuencia lo son, mas potentes 
para detectar diferencias poblacionales cuando las suposiciones no se satisfacen. Por esta 
razon, muchos expertos en estadistica estan a favor del uso de procedimientos estadisticos no 
parametricos en vez de sus equivalentes parametricos. 


15.2 Modelo general de desplazamiento (o cambio) 
de dos muestras 

Es comun que un experimentador tome observaciones de dos poblaciones con el fin de probar 
si tienen la misma distribucion. Por ejemplo, si muestras aleatorias independientes Aj, X 2 ,..., 
X y 7j, Y 2 ,..., Y„ 2 se toman de poblaciones normales con iguales varianzas y medias respec- 
tivas p x y p Y , el experimentador puede desear probar H 0 : p, x — p Y = 0 contra H a : p, x — p Y 
< 0. En este caso, si H 0 es verdadera, ambas poblaciones estan distribuidas normalmente con 
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FIGURA 15.1 
Dos distribuciones 
normales con va- 
rianzas iguales pero 
medias desiguales 




cantidad de desplazamiento 


la misma media y la misma varianza; esto es, las distribuciones de poblacion son identicas. Si 
H a es verdadera, entonces p. Y > p x y las distribuciones de X r y K, son iguales, excepto que el 
parametro de localizacion (/jl y ) para Y x es mayor que el parametro de localizacion (p. x ) para 
X v En consecuencia, la distribucion de K, se desplaza a la derecha de la distribucion de X, 
(vea Figura 15.1). 

Este es un ejemplo de un modelo de desplazamiento (o localizacion) parametrico de dos 
muestras. El modelo es parametrico porque las distribuciones estan especificadas (normales) 
excepto para los valores de los parametros /i x , p Y y <x 2 . La cantidad que la distribucion de Y x 
se desplaza a la derecha de la distribucion de X l es /jl y — pt x (vea la Figura 15.1). En el resto 
de esta seccion definimos un modelo de desplazamiento que se aplica para cualquier distribu¬ 
cion, normal o de otro tipo. 

Sea X] , X 2 , ..., X ni una muestra aleatoria de una poblacion con funcion de distribucion F(x) 
y sea Y\ , F 2 ,..., F„ 2 una muestra aleatoria de una poblacion con funcion de distribucion G(y). Si 
deseamos probar que las dos poblaciones tienen la misma distribucion, es decir, H 0 : F(z) = G(z) 
contra H a : /•’(") ¥= G(z), con la forma real de F(z) y G(z) no especificada, se requiere un metodo 
no parametrico. Observe que H a es una hipotesis muy general. Muchas veces, un experimentador 
puede querer considerar la hipotesis alternativa mas especffica de que Y t tiene la misma distribucion 
que X l desplazada una cantidad 6 (desconocida) (vea Figura 15.2), es decir, que las distribucio¬ 
nes difieren en localizacion. Entonces G (y) = P{Y\ < y) = P(X\ < y — 6) = F(y — 9) 
para algun valor 0 de parametro desconocido. Observe que la forma particular de F(x) continua 
no especificada. 

En todo este capltulo, si nos referimos al modelo de desplazamiento (localizacion) de dos 
muestras, suponemos que X { , X 2 , ..., constituyen una muestra aleatoria de la funcion de 
distribucion F(x) y que Y v Y 2 ,..., Y ni constituyen una muestra aleatoria de la funcion de dis¬ 
tribucion G(y) = F(y — 9) para algun valor desconocido 9. Para el modelo de desplazamiento 
de dos muestras, Fl 0 : F(z) = G(z) es equivalente a // () : 9 = 0. Si 9 es mayor (menor) que 0, 
entonces la distribucion de los valores Y esta ubicada a la derecha (izquierda) de la distribu¬ 
cion de los valores X. 


FIGURA 15.2 
Dos funciones de 
densidad, con la den- 
sidad para Y despla¬ 
zada 6 unidades a la 
derecha de la de X 
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15.3 Prueba de signos para un experimento 
de observaciones pareadas 

Suponga que tenemos n pares de observaciones de la forma (X t , Y t ) y que deseamos probar 
la hipotesis de que la distribucion de las X es igual a la de las Y, contra la alternativa de que 
las distribuciones difieren en ubicacion (vea Seccion 15.2). De manera similar a la que vimos 
en la Seccion 12.3, hagamos D ] = X t — Y v Una de las pruebas no parametricas mas sencillas 
esta basada en los signos de estas diferencias y, con justificada razon, se denomina prueba de 
signos. Dada la hipotesis nula de que X t y Y i provienen de las mismas distribuciones continuas 
de probabilidad, la probabilidad de que /) sea positiva es igual a 1 /2 (como lo es la probabilidad de 
que D i sea negativa). Denotemos con M el numero total de diferencias positivas (o negativas). 
Entonces, si las variables X f y Y { tienen la misma distribucion, M tiene una distribucion bino¬ 
mial con p = 1/2 y la region de rechazo para una prueba basada en M se puede obtener con 
el uso de la distribucion binomial de probabilidad introducida en el Capftulo 3. La prueba de 
signos se resume de la siguiente manera. 


Prueba de signos para un experimento de observaciones pareadas 

Sea p = P(X>Y). 

Hipotesis nula: H 0 : p = 1 / 2. 

Hipotesis alternativa: H a : p > 1/2 o (p < 1/2 o p 1/2). 

Estadfstico de prueba: M = numero de diferencias positivas donde D t = X t — Y t . 
Region de rechazo: para H a : p > 1/2, rechazar H 0 para los valores mas grandes de 
M; para H a : p < 1 /2, rechazar //„ para los valores mas pequenos de M; para H a : p 
A 1 /2, rechazar H 0 para valores muy grandes o muy pequenos de M. 

Suposiciones: los pares (X jt Y t ) se seleccionan en forma aleatoria e independiente. 


El siguiente ejemplo ilustra el uso de la prueba de signos. 


EJEMPLO 15.1 El numero de fusibles electricos defectuosos producidos por cada una de dos lfneas de pro¬ 
duction, A y B, se registro diariamente durante un periodo de 10 dfas y se obtuvieron los 
resultados de laTabla 15.1. Suponga que ambas lfneas produjeron la misma cantidad todos los dfas. 
Compare el numero de piezas defectuosas producidas por A y B cada dfa y sea M igual al 
numero de dfas cuando A rebaso a B. ^Los datos presentan suficiente evidencia para indicar 
que cualquiera de las lfneas produce mas piezas defectuosas que la otra? Exprese la hipotesis 
nula a probar y use M como un estadfstico de prueba. 

Solution Forme pares de las observaciones como aparecen en la tabulation de datos y considere M 
como el numero de dfas en que el numero observado de piezas defectuosas de la lfnea A es 
mayor que las de la lfnea B. Dada la hipotesis nula de que las dos distribuciones de piezas 
defectuosas son identicas, la probabilidad p de que A exceda a B para un par dado es p = .5, 
dado que no hay empates. En consecuencia, la hipotesis nula es equivalente a la hipotesis de 
que el parametro binomial es p = .5. 
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Tabla 15.1 Datos para el ejemplo 15.1 


Dfa 

A 

B 

1 

172 

201 

2 

165 

179 

3 

206 

159 

4 

184 

192 

5 

174 

177 

6 

142 

170 

7 

190 

182 

8 

169 

179 

9 

161 

169 

10 

200 

210 


Valores muy grandes o muy pequenos de M contradicen la hipotesis nula. Por tanto, la 
region de rechazo para la prueba se ubicara al incluir los valores extremos de M que al mismo 
tiempo dan un valor de a que es apropiado para la prueba. 

Suponga que nos gustarfa que el valor de a fuera del orden de .05 o .10. Comenzamos la 
selection de la region de rechazo al incluir M = 0 y M = lOy calcular la a asociada con esta 
region usando p(y), la distribucion de probabilidad para la variable binomial aleatoria (vea el 
Capitulo 3). Con n = 10, p = .5, tenemos 


a = p(0) + p (10) = (^(.5)'° + ( Jq )(- 5 ) 10 = - 002 - 

Como este valor de a es demasiado pequeno, la region se expandira si se incluye el siguiente 
par de valores M que se oponen a la hipotesis nula, M = 1 y M = 9. El valor de a para esta 
region (M = 0, 1, 9, 10) se puede obtener de la Tabla 1, Apendice 3: 

a = p( 0) + p(l) + p( 9) + p(10) = .022. 


Este tambien es demasiado pequeno, de modo que expandimos la region otra vez para in¬ 
cluir M = 0, 1, 2, 8, 9, 10. Se puede verificar que el correspondiente valor de a es .11. 
Suponga que este valor de a es aceptable para el experimentador; entonces empleamos 
M = 0, 1, 2, 8, 9, 10 como la region de rechazo para la prueba. 

De los datos, observamos que m = 2, de modo que rechazamos la hipotesis nula. Concluimos 
que existe suficiente evidencia para indicar que las distribuciones poblacionales de las canti- 
dades de fusibles defectuosos no son identicas. La probabilidad de rechazar la hipotesis nula 
cuando es verdadera es solo a = . 11 y por tanto tenemos una confianza razonable en nuestra 
conclusion. 

El experimentador en este ejemplo esta usando el procedimiento de prueba como herra- 
mienta burda para detectar lfneas de produccion con falla. No es probable que el valor hasta 
cierto punto grande de a lo altere porque el puede facilmente recolectar datos adicionales si 
esta preocupado por cometer un error tipo I en su conclusion. ■ 


Los niveles de signibcancia alcanzados (valores p) para la prueba de signos se calculan 
como se indica en la Seccion 10.6. Especfficamente, si n = 15 y deseamos probar H 0 : p = 
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1 /2 contra H a : p < 1/2 con base en el valor observado de M = 3, la Tabla 1 del Apendice 3 
se puede usar para determinar que (como n = 15, p = 1/2) 

valor p = P(M < 3) = .018. 

Para la prueba de dos colas ( H a \pj=\ /2), valor p = 2(.018) = .036. 

EJEMPLO 15.2 

Encuentre el valor p asociado con la prueba de signo efectuada en el Ejemplo 15.1. 

Solucion 

La prueba del Ejemplo 15.1 es una prueba de dos colas de //„ : p = 1/2 contra H a : p =f= 1/2. 
El valor calculado de M es m = 2, de modo que el valor p es 2 P(M < 2). De acuerdo con la 
hipotesis nula, M tiene una distribucion binomial con n = 10, p = .5 y la Tabla 1, Apendice 
3, da como resultado 

valor p = 2P(M < 2) = 2(.055) = .11. 

Entonces, .11 es el valor mas pequeho de a para el cual la hipotesis nula se puede rechazar. 
Observe que el metodo del valor p da como resultado la misma decision a la que se llego en el 
Ejemplo 15.1 donde se utilizo una prueba formal de nivel a = .11. No obstante, el metodo del 
valor p elimino la necesidad de intentar varias regiones de rechazo hasta encontrar una con un 
valor satisfactorio para a. ■ 


Un problema que puede surgir en relacion con una prueba de signos es que las observacio- 
nes asociadas con uno o mas pares pueden ser iguales y por tanto puede resultar en empates. 
Cuando se presente esta situacion, borre los pares empatados y reduzca n, el numero total de 
pares. 

Usted tambien hallara situaciones donde n, el numero de pares, es grande. Entonces, los 
valores de a asociados con la prueba de signos pueden calcularse si se usa la aproximacion 
normal a la distribucion binomial de probabilidad que estudiamos en la Seccion 7.5. Es posi- 
ble verificar (al comparar probabilidades exactas con sus aproximaciones) que estas aproxi- 
maciones seran bastante adecuadas para n de valor muy pequeno, 10 o 15. Este resultado se 
debe a la simetrfa de la distribucion binomial de probabilidad para p = .5. Para n > 25, la 
prueba Z del Capltulo 10 sera suficiente, donde 

? M — np M—n/ 2 

sjnpq (l/2)\/n' 

Este estadfstico se usarfa para probar la hipotesis nula p = .5 contra la alternativa p A .5 
para una prueba de dos colas o contra la alternativa p > .5 (o p < .5) para una prueba de una 
cola. Las pruebas usarfan las conocidas regiones de rechazo del Capftulo 10. 

Los datos del Ejemplo 15.1 son el resultado de un experimento de observaciones pareadas. 
Suponga que las diferencias de estas se distribuyen normalmente con una varianza comun a 2 . 
( ',La prueba de signos detectara un desplazamiento en la localizacion de las dos poblaciones, 
en forma tan eficiente como la prueba t de Student? Intuitivamente sospecharfamos que la 
respuesta es negativa y esto es correcto porque la prueba t de Student usa comparativamente 
mas informacion. Ademas de dar el signo de la diferencia, la prueba t usa las magnitudes 
de las observaciones para obtener valores mas precisos para medias muestrales y varianzas. 
Entonces, podemos decir que la prueba de signos no es tan “eficiente” como la prueba t de 
Student; pero este enunciado es significativo solo si las poblaciones se ajustan a la suposicion 
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que acabamos de expresar: las diferencias en observaciones pareadas estan distribuidas nor- 
malmente con una varianza comun (rj r La prueba de signos podria ser mas eficiente cuando 
estas suposiciones no se satisfacen. 


Prueba de signos para muestras grandes: n > 25 

Hipotesis nula: H 0 : p = .5 (ninguno de estos tratamientos se prefiere al otro). 

Hipotesis alternativa: H a : p ¥= .5 para una prueba de dos colas ( Nota : usamos la 
prueba de dos colas para un ejemplo. Muchos analisis requieren una prueba de una 
cola). 

Estadfstico de prueba: Z = [M — n /2]/[(l/2)y / n], 

Region de rechazo: rechazar H 0 si z s z a / 2 o si z ^ ~z a / 2 , donde z a / 2 se obtiene de la 
Tabla 3, Apendice 3. 


La prueba de signos en realidad prueba la hipotesis nula de que la mediana de las variables 
Dj es cero contra la alternativa de que es diferente de cero. [Si la mediana de las variables D t 
es cero, implica que P ( D I < 0 ) = P(D t > 0).] Si las variables X t y Y t tienen la misma distribu¬ 
tion, la mediana de las variables D i sera cero, como ya dijimos antes. No obstante, para mode- 
los que no sean el modelo de desplazamiento hay otras situaciones en las que la mediana de las 
variables /? es cero. En estos casos la hipotesis nula para la prueba de signos es ligeramente 
mas general que el enunciado de que X i y Y i tienen la misma distribution. 

Resumiendo, la prueba de signos es un procedimiento no parametrico que se aplica con 
facilidad para comparar dos poblaciones. No se hacen suposiciones respecto a las distribu- 
ciones poblacionales que sirven de base. El valor del estadfstico de prueba se puede obtener 
rapidamente por conteo visual y la region de rechazo (o valor p) se puede hallar sin problema 
si se usa una tabla de probabilidades binomiales. Ademas, no es necesario conocer los valores 
exactos de pares de respuestas, solo si X l > Y l para cada par (X-, Yl). El Ejercicio 15.5 muestra 
un ejemplo del uso de la prueba de signos para datos de este tipo. 


Ejercicios 

15.1 ^Que niveles de significancia entre cr=.01ya = .15 hay para una prueba de signos de dos colas con 
25 observaciones pareadas? (Haga uso de valores tabulados en la Tabla 1, Apendice 3, n = 25.) ^Cuales 
son las correspondientes regiones de rechazo? 

15.2 Un estudio publicado en la American Journal of Public Health (Science News) —el primero en seguir 
niveles de plomo en la sangre de aficionados a portar armas pero que son respetuosos de las leyes y usan 
polfgonos de tiro bajo techo— demuestra un considerable riesgo de envenenamiento por plomo. 1 Las 
mediciones de exposicion al plomo se hicieron en 17 miembros de un grupo de estudiantes a oficiales 
de policfa antes, durante y despues de un periodo de 3 meses de instruccion sobre manejo de armas de 
fuego en un polfgono de tiro bajo techo propiedad del gobierno. Ninguno de los alumnos tenia niveles 
elevados de plomo en la sangre antes del curso, pero 15 de los 17 terminaron el curso con niveles de plo¬ 
mo en la sangre considerados como “elevados” por la Occupational Safety and Health Administration 
(OSHA). i,Hay suficiente evidencia para decir que el polfgono de tiro en interiores aumenta las lecturas 
del nivel de sangre? 


1. Fuente: Science News, 136 (agosto de 1989): 126. 
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a Proporcione el valor p asociado. 

b ^Que se concluiria con un nivel de significancia a = .01? 

c Use la aproximacion normal para dar el valor p aproximado. ^La aproximacion parece ser adecuada 
cuando n= 17? 

15.3 Datos clmicos relacionados con la efectividad de dos medicamentos para tratar una enfermedad se 
recolectaron de diez hospitales. El numero de pacientes tratados con los medicamentos difirio para los 
diversos hospitales. Los datos se dan en la siguiente tabla. 


Hospital 


Medicamento A 



Medicamento B 


Numero 

tratado 

Numero de 
recuperados 

Porcentaje de 
recuperados 

Numero 

tratado 

Numero de 
recuperados 

Porcentaje de 
recuperados 

1 

84 

63 

75.0 

96 

82 

85.4 

2 

63 

44 

69.8 

83 

69 

83.1 

3 

56 

48 

85.7 

91 

73 

80.2 

4 

77 

57 

74.0 

47 

35 

74.5 

5 

29 

20 

69.0 

60 

42 

70.0 

6 

48 

40 

83.3 

27 

22 

81.5 

7 

61 

42 

68.9 

69 

52 

75.4 

8 

45 

35 

77.8 

72 

57 

79.2 

9 

79 

57 

72.2 

89 

76 

85.4 

10 

62 

48 

77.4 

46 

37 

80.4 


a ^Los datos indican una diferencia en los porcentajes de recuperation para los dos medicamentos? 

Proporcione el valor p asociado. 

b ^Por que podrfa ser inapropiado usar la prueba t para analizar los datos? 

15.4 Para una comparacion de la efectividad academica de dos escuelas secundarias A y B se diseno un expe- 
rimento usando diez parejas de mellizos identicos, cada uno de los cuales acababa de terminar el sexto 
ano escolar. En cada caso, los mellizos de la misma pareja hablan obtenido su escolaridad previa en los 
mismos salones de clase en cada nivel escolar. Un nino fue seleccionado aleatoriamente de cada pareja 
y asignado a la escuela A; el otro fue enviado a la escuela B. Cerca ya de terminar el noveno grado, 
se aplico un examen de conocimientos a cada nino del experimento. Los resultados se muestran en la 
siguiente tabla. 


Par de mellizos 

A 

B 

Par de mellizos 

A 

B 

1 

67 

39 

6 

50 

52 

2 

80 

75 

7 

63 

56 

3 

65 

69 

8 

81 

72 

4 

70 

55 

9 

86 

89 

5 

86 

74 

10 

60 

47 


a Usando la prueba de signos, pruebe la hipotesis de que las dos escuelas son iguales en efectividad 
academica, segun se mide con las calificaciones del examen de conocimientos, contra la alternativa 
de que las escuelas no son igualmente eficientes. De el nivel de significancia alcanzado. ^Que con¬ 
cluiria usted con a = .05? 

b Supongamos que se considera que la escuela secundaria A tiene un mejor profesorado y mejores ins- 
talaciones para la ensenanza. Pruebe la hipotesis de igual efectividad academica contra la alternativa 
de que la escuela A es superior. ^Cual es el valor p asociado con esta prueba? 

15.5 Los productos alimenticios nuevos son sometidos frecuentemente a pruebas de sabor por un panel de 
jueces, a quienes por lo general se les pide expresen su preferencia por un alimento sobre otro para que 
no hay a necesidad de usar una escala cuantitativa. Suponga que dos nuevas mezclas, A y B. de un re- 
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fresco de sabor naranja se presentan a diez jueces. Las preferencias de los jueces se proporcionan en la 
siguiente tabla. ^Esta evidencia indica una diferencia importante entre los gustos de A y B, con un nivel 
de significancia de 5%? 


Juez 

Preferencia 

Juez 

Preferencia 

1 

A 

6 

A 

2 

A 

7 

B 

3 

A 

8 

A 

4 

A 

9 

B 

5 

A 

10 

A 


15.6 En noches claras y frfas de la region productora de cftricos del centra de Florida, la ubicacion precisa 
de las temperaturas abajo del punto de congelation es importante porque los metodos para proteger 
los arboles contra condiciones de congelamiento son muy costosos. Un metodo para ubicar probables 
puntos frfos consiste en relacionar la temperatura con la elevation. Se piensa que en noches en calma los 
puntos frfos estaran en elevaciones bajas. Los puntos mas altos y mas bajos de una plantation particular 
dieron las temperaturas mfnimas que se titan en la siguiente tabla, para diez noches frfas en un invierno 
reciente. 


Noche 

Elevation alta 

Elevation baja 

1 

32.9 

31.8 

2 

33.2 

31.9 

3 

32.0 

29.2 

4 

33.1 

33.2 

5 

33.5 

33.0 

6 

34.6 

33.9 

7 

32.1 

31.0 

8 

33.1 

32.5 

9 

30.2 

28.9 

10 

29.1 

28.0 


a ^Hay evidencia suficiente para apoyar la conjetura de que elevaciones bajas tienden a ser mas frfas? 

(Use la prueba de signos. De el valor p asociado.) 
b < : ,Seria razonable usar una prueba t en estos datos? ^Por que sf o por que no? 

15.7 Se realizo un experimento psicologico para comparar los tiempos de respuesta (en segundos) para dos es- 
tfmulos diferentes. Para eliminar la variabilidad natural de una persona a otra en las respuestas, ambos 
estfmulos se aplicaron a cada uno de nueve sujetos, permitiendo as( un analisis de la diferencia entre los 
tiempos de respuesta de cada persona. Los resultados se presentan en la siguiente tabla. 


Sujeto 

Estfmulo 1 

Estfmulo 2 

1 

9.4 

10.3 

2 

7.8 

8.9 

3 

5.6 

4.1 

4 

12.1 

14.7 

5 

6.9 

8.7 

6 

4.2 

7.1 

7 

00 

bo 

11.3 

8 

7.7 

5.2 

9 

6.4 

7.8 
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a Use la prueba de signos para determinar si existe suficiente evidencia para indicar una diferencia en 
la respuesta media para los dos estfmulos. Use una region de rechazo para la cual a £ .05. 
b Pruebe la hipotesis de que no haya diferencia en la respuesta media, usando una prueba t de 
Student. 

15.8 Consulte el Ejercicio 12.15. Usando la prueba de signos, ^encuentra suficiente evidencia para apoyar la 
conclusion de que los tiempos de terminacion difieren para las dos poblaciones? Use a = .10. 

15.9 El conjunto de datos de la siguiente tabla representa el numero de accidentes industriales en 12 plantas de 
manufacture, durante periodos de una semana antes y despues de intensa promocion sobre seguridad. 


Planta 

Antes 

Despues 

Planta 

Antes 

Despues 

1 

3 

2 

7 

5 

3 

2 

4 

1 

8 

3 

3 

3 

6 

3 

9 

2 

0 

4 

3 

5 

10 

4 

3 

5 

4 

4 

11 

4 

1 

6 

5 

2 

12 

5 

2 


a ^Los datos apoyan la afirmacion de que la campana fue un exito? ^,Cual es el nivel de significancia 
alcanzado? ^Que concluirfa usted con a = .01? 

b Analice los problemas asociados con un analisis parametrico disenado para contestar la pregunta del 
inciso a. 

15.4 Prueba de rangos con signo de Wilcoxon para 
un experimento de observaciones pareadas 

A1 igual que en la Seccion 15.3 suponga que tenemos n observaciones pareadas de la forma 
(Xj, Y : ) y que D t = X t — Y t . De nuevo suponemos que estamos interesados en probar la hipote¬ 
sis de que las X y las Y tienen la misma distribucion contra la alternativa de que las distribu- 
ciones difieren en localizacion. De acuerdo con la hipotesis nula de que no hay diferencia en 
las distribuciones de las X y las Y, se esperarfa (en promedio) que la mitad de las diferencias 
en los pares sean negativas y la mitad positivas. Esto es, el numero esperado de diferencias 
negativas entre pares es n /2 (donde n es el numero de pares). Ademas, se podria inferir que 
las diferencias positivas y negativas de igual magnitud absoluta deberfan presentarse con la 
misma probabilidad. Si ordenaramos las diferencias de acuerdo con sus valores absolutos y 
las clasificaramos de menor a mayor, las sumas de los rangos esperados para las diferencias 
negativas y positivas serfan iguales. Las diferencias grandes en las sumas de los rangos asig- 
nados a las diferencias positivas y negativas darfan evidencia para indicar un desplazamiento 
de localizacion entre las dos distribuciones. 

Para llevar a cabo la prueba de Wilcoxon calculamos las diferencias (D,) para cada uno de 
los n pares. Las diferencias iguales a cero se eliminan y el numero de pares, n, se reduce de con- 
formidad. Entonces clasificamos los valores absolutos de las diferencias asignando un 1 al mas 
pequeno, un 2 al segundo mas pequeno y asf sucesivamente. Si dos o mas diferencias absolutas 
estan empatadas para el mismo rango, entonces el promedio de las clasificaciones que se hubie- 
ran asignado a estas diferencias se asigna a cada miembro del grupo empatado. Por ejemplo, si 
dos diferencias absolutas estan empatadas para los rangos 3 y 4, entonces cada una recibe clasifi¬ 
caciones 3.5 y a la siguiente diferencia absoluta mas alta se le asigna el rango 5. Entonces calcu¬ 
lamos la suma de los rangos (suma de rango) para las diferencias negativas y tambien calculamos 
la suma de rango para las diferencias positivas. Para una prueba de dos colas usamos T, la mas 
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pequeiia de estas dos cantidades, como estadfstico de prueba para probar la hipotesis nula de que 
los dos histogramas de frecuencia relativa poblacionales son identicos. Cuanto menor sea el valor 
de T , mayor sera el valor de evidencia a favor del rechazo de la hipotesis nula. En consecuencia, 
rechazaremos la hipotesis nula si T es menor o igual a algiin valor, por ejemplo, T 0 . 

Para detectar la alternativa unilateral, que afirma que la distribucion de las X se desplaza a 
la derecha de la de las Y, usamos la suma de rango T de las diferencias negativas y rechaza- 
mos la hipotesis nula para valores pequenos de T~, por ejemplo, T < 7 0 . Si deseamos detectar 
un desplazamiento de la distribucion de las Y a la derecha de las X. usamos la suma de rango 
T + de las diferencias positivas como estadfstico de prueba y rechazamos valores pequenos 
de T + , por ejemplo, T + < T 0 . 

La probabilidad de que T sea menor o igual a algun valor T 0 se ha calculado para una com- 
binacion de tamanos muestrales y valores de T 0 . Estas probabilidades, dadas en la Tabla 9, 
Apendice 3, se pueden usar para hallar la region de rechazo para la prueba basada en T. 

Por ejemplo, supongamos que usted tiene n = 7 pares y desea realizar una prueba de dos 
colas de la hipotesis nula de que las dos distribuciones de frecuencia relativa poblacionales 
son identicas. Entonces, con a = .05, rechazarfa la hipotesis nula para todos los valores de T 
menores o iguales a 2. La region de rechazo para la prueba Wilcoxon de suma de rango para 
un experimento pareado es siempre de esta forma: rechazar la hipotesis nula si T < T 0 donde 
T 0 es el valor crftico para T. Los lfmites para el nivel de significancia alcanzado (valor p) se 
determinan como sigue. Para una prueba de dos colas, si T = 3 se observa cuando n = 7, la 
Tabla 9, Apendice 3, indica que 77 0 serfa rechazada si a = .1. pero no si a = .05. Entonces, 
.05 < valor p < . 1. Para una alternativa unilateral de que las X estan desplazadas a la derecha 
de las Y con n = 7 y a = .05, 77 0 es rechazada si T = T < 4. En este caso, si T = T~ = 1, 
entonces .01 < valor p < .025. La prueba basada en /’. llamada prueba de de rangos con signo 
Wilcoxon, se resume como sigue. 


Prueba de rangos con signo de Wilcoxon para un experimento 
de observaciones pareadas 

77 0 : las distribuciones poblacionales para las X y las Y son identicas. 

H a : (1) las dos distribuciones poblacionales difieren en localization (dos colas), o 
bien (2) la distribucion de frecuencia relativa poblacional para las X se desplaza 
a la derecha de la de las Y (una cola). 

Estadfstico de prueba: 

1. Para una prueba de dos colas, use T = mfn(7’ + , T ), donde T + = suma de los 
rangos de las diferencias positivas y T~ = suma de los rangos de las diferencias 
negativas. 

2. Para una prueba de una cola (para detectar la alternativa de una cola que acaba- 
mos de dar), use la suma de rango T~ de las diferencias negativas. 2 

Region de rechazo: 

1. Para una prueba de dos colas, rechace 77 0 si T< T 0 , donde 7 0 es el valor crftico para 
la prueba de dos lados dada en la Tabla 9, Apendice 3. 

2. Para una prueba de una cola (como se describe lfneas antes), rechace H 0 si T~ < 
T 0 , donde T 0 es el valor crftico para la prueba unilateral. 


2. Para detectar un desplazamiento de la distribucion de las Y a la derecha de la distribucion de las X, use la suma de 
rango T + , la suma de los rangos de las diferencias positivas, y rechace H 0 si T + < 7 0 . 
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EJEMPLO 15.3 Debido a la variation de un homo a otro, se utilizo un experimento de observaciones pareadas 
para probar diferencias en pasteles elaborados usando la mezcla A y la mezcla B. Dos pasteles 
elaborados usando cada mezcla, se hornearon en cada uno de seis hornos diferentes (un total 
de 12 pasteles). Pruebe la hipotesis de que no hay diferencia en las distribuciones poblaciona- 
les de las densidades de pastel usando las dos mezclas. ^Que se puede decir acerca del nivel 
de significancia alcanzado? 


Solution Los datos originales y las diferencias en densidades (en onzas por pulgada cubica) para los 
seis pares de pasteles se muestran en la Tabla 15.2. 

A1 igual que con otras pruebas no parametricas, la hipotesis nula a probar es que las dos 
distribuciones de frecuencia poblacionales de densidades de pastel son identicas. La hipotesis 
alternativa es que las distribuciones difieren en localization, lo cual implica que se requiere 
una prueba de dos colas. 

Debido a que la cantidad de datos es pequena, realizaremos nuestra prueba usando a = .10. 
De la Tabla 9, Apendice 3, el valor crftico de T para una prueba de dos colas, a = . 10, es 7 0 = 
2. En consecuencia, rechazaremos H 0 si T < 2. 

Hay solo una diferencia positiva y tiene rango 3; por tanto, T + = 3. Como T + + T~ = n(n 
+ l)/2 (^por que?), T~ = 21 — 3 = 18 y el valor observado de T es mm(3, 18) = 3. Observe 
que 3 excede el valor crftico de T, lo cual implica que no hay suficiente evidencia para indicar 
una diferencia en las dos distribuciones de frecuencia poblacional en las densidades de los 
pasteles. Como no podemos rechazar H 0 para a = .10, solo podemos decir que valor p > 
. 10 . 


Tabla 15.2 Datos pareados y sus diferencias para el Ejemplo 15.3 


A 

B 

Diferencia 

A - B 

Diferencia 

absoluta 

Rango de 

diferencia absoluta 

.135 

.129 

.006 

.006 

3 

.102 

.120 

-.018 

.018 

5 

.108 

.112 

-.004 

.004 

1.5 

.141 

.152 

-.011 

.011 

4 

.131 

.135 

-.004 

.004 

1.5 

.144 

.163 

-.019 

.019 

6 


Aunque la Tabla 9, Apendice 3, es aplicable para valores de n (el numero de pares de datos) 
de hasta n = 50, es conveniente observar que T + (o T~) estara distribuida normalmente en for¬ 
ma aproximada cuando la hipotesis nula sea verdadera y n sea grande (25 o mas, por ejemplo). 
Esto hace posible que construyamos una prueba Z de muestra grande, donde si 7’ = T + , 


E(T + ) 


n{n + 1) 
4 


y 


, n(n + 1)(2« + 1) 

V(T + ) = — ---- 

24 


Entonces el estadistico Z 


Z = 


T + 


E (T+) _ T + -[«(« + l)/4] 
V«(« + l)(2n + l)/24 
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se puede usar como estadfstico de prueba. Entonces, para una prueba de dos colas y a = .05, 
rechazarfamos la hipotesis de distribuciones poblacionales identicas cuando |z| > 1.96. Para 
una prueba de una cola de que la distribucion de las X esta desplazada a la derecha (izquierda) 
de la distribucion de las Y, rechace H 0 cuando z > z a (z<~ Z a ). 


Una prueba de rangos con signo de Wilcoxon con muestras grandes para un 
experimento de observaciones pareadas: n > 25 


Hipotesis nula: H 0 : las distribuciones de frecuencia relativa poblacionales para las 
X y las Y son identicas. 

Hipotesis alternativa: (1) H a : las dos distribuciones de frecuencia relativa poblacio¬ 
nales difieren en localization (una prueba de dos colas), 

o bien, (2) la distribucion de frecuencia relativa poblacional para las X esta des¬ 
plazada a la derecha (o izquierda) de la distribucion de frecuencia relativa de las Y 
(pruebas de una cola). 


Estadfstico de prueba Z 


T + - [n(n + l)/4] 

v«(« + l)( 2 n + 1 ) / 24" 


Region de rechazo: rechazar // 0 si z > z a / 2 o z ^ ~z a / 2 para una prueba de dos colas. 
Para detectar un desplazamiento en las distribuciones de las X a la derecha de las Y, 
rechazar H 0 cuando z — z a . Para detectar un desplazamiento en la direction opuesta, 
rechazar H 0 si z < - z a . 


Ejercicios 

Se lleva a cabo un experimento de observaciones pareadas que usa n pares de observaciones, si T + = la 
suma de las columnas de los valores absolutos de las diferencias positivas y T~ = la suma de las colum- 
nas de los valores absolutos de las diferencias negativas, ^,por que es T + + T~ = n(n + l)/2? 

Consulte el Ejercicio 15.10. Si T + se ha calculado, ^,cual es la forma mas facil de determinar el valor de 
T~? Si T + > n(n + l)/4, ^es T = T + o T“? ^Por que? 

La siguiente tabla muestra las calificaciones de un grupo de 15 estudiantes en matematicas y artes. 


Estudiante 

Matematicas 

Artes 

Estudiante 

Matematicas 

Artes 

1 

22 

53 

9 

62 

55 

2 

37 

68 

10 

65 

74 

3 

36 

42 

11 

66 

68 

4 

38 

49 

12 

56 

64 

5 

42 

51 

13 

66 

67 

6 

58 

65 

14 

67 

73 

7 

58 

51 

15 

62 

65 

8 

60 

71 





a Use la prueba de rangos con signo de Wilcoxon para determinar si las localizaciones de las distribu¬ 
ciones de calificaciones para estos estudiantes difieren de manera importante para las dos materias. 
Establezca lfmites para el valor p e indique la conclusion apropiada cuando a — .05. 
b Exprese las hipotesis nula y alternativa para la prueba que realizo en el inciso a. 
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15.13 Consulte el Ejercicio 15.4. ^Que respuestas se obtienen si la prueba de rangos con signo de Wilcoxon se 
usa en el analisis de los datos? Compare estas respuestas con las obtenidas en el Ejercicio 15.4. 

15.14 Consulte el Ejercicio 15.6(a). Conteste la pregunta usando la prueba de rangos con signo de Wilcoxon. 

15.15 A ocho personas se les pidio ejecutaran un sencillo trabajo de ensamblar un rompecabezas en condicio- 
nes normales y en condiciones de estres. Durante la condition de estres, a las personas se les indico que 
se les aplicana una ligera descarga electrica 3 minutos despues de empezar el experimento y cada 30 
segundos de ahl en adelante hasta terminar el trabajo. Las lecturas de presion sangulnea se tomaron en 
ambas condiciones. Los datos de la siguiente tabla representan la lectura mas alta durante el experimen¬ 
to. 


Sujeto 

Normal 

Estres 

1 

126 

130 

2 

117 

118 

3 

115 

125 

4 

118 

120 

5 

118 

121 

6 

128 

125 

7 

125 

130 

8 

120 

120 


^Los datos presentan suficiente evidencia para indicar lecturas de presion sangulnea mas alta durante 
los condiciones de estres? Analice los datos usando la prueba de rangos con signo de Wilcoxon para un 
experimento de observaciones pareadas. Proporcione el valor p apropiado. 

15.16 Se emplearon dos metodos, A y B, para controlar el transito en cada uno den = 12 cruceros durante una 
semana. Los numeros de accidentes que ocurrieron durante este tiempo se registraron en la siguiente 
tabla. El orden de uso (cual metodo se empleo para la primera semana) se eligio aleatoriamente para 
cada crucero. 


Crucero 

Metodo 

A 

Metodo 

B 

Crucero 

Metodo 

A 

Metodo 

B 

1 

5 

4 

7 

2 

3 

2 

6 

4 

8 

4 

1 

3 

8 

9 

9 

7 

9 

4 

3 

2 

10 

5 

2 

5 

6 

3 

11 

6 

5 

6 

1 

0 

12 

1 

1 


a Analice estos datos usando la prueba de signos. 

b Analice estos datos usando la prueba de rangos con signo de Wilcoxon para un experimento de ob¬ 
servaciones pareadas. 

15.17 Investigadores en odontologla han desarrollado un nuevo material para prevenir la caries, un sella- 
dor plastico que se aplica a las superficies de mastication de los dientes. Para determinar si el sellador 
es eficaz, se aplico a la mitad de los dientes de cada uno de 12 ninos en edad escolar. Despues de 
2 anos se hizo un recuento del numero de caries en los dientes con sellador y en los dientes no tra- 
tados. Los resultados se muestran en la siguiente tabla. (,Hay suficiente evidencia para indicar que 
los dientes con sellador son menos propensos a la caries que los dientes no tratados? Pruebe usando 
a = 0.05. 
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Nino 

Con sellador 

No tratado 

Nino 

Con sellador 

No tratado 

1 

3 

3 

7 

1 

5 

2 

1 

3 

8 

2 

0 

3 

0 

2 

9 

1 

6 

4 

4 

5 

10 

0 

0 

5 

1 

0 

11 

0 

3 

6 

0 

1 

12 

4 

3 


15.18 Consulte el Ejercicio 12.16. Con a = .01, use la prueba de rangos con signo de Wilcoxon para ver si 
hubo una perdida importante en la profundidad del humus entre el principio y el fin del estudio. 

15.19 Suponga que Kj, Y 2 , ..., Y n es una muestra aleatoria de una funcion de distribution continua F(y). Se 
desea probar una hipotesis respecto a la mediana f de F(y). Construya una prueba de H 0 : f f 0 contra 
H a : f # £ 0 , donde es una constante especificada. 

a Use la prueba de signos. 

b Use la prueba de rangos con signo de Wilcoxon. 

15.20 El vocero de una organization que apoya reducciones en impuesto a la propiedad, de cierta section de 
una ciudad, expreso que el ingreso medio anual de los jefes de familia en esa section era de $15 000. 
Una muestra aleatoria de diez jefes de familia de esa section revelo los siguientes ingresos anuales: 

14 800 16 900 18 000 19 100 13 200 
18 500 20 000 19 200 15 100 16 500 

Con a = .10, pruebe la hipotesis de que el ingreso medio para la poblacion de esa section es $15 000 
contra la alternativa de que sea mayor que $15 000. 

a Use la prueba de signos. 

b Use la prueba de rangos con signo de Wilcoxon. 

15.5 Uso de rangos para comparar 

dos distribuciones poblacionales: 
muestras aleatorias independientes 

Una prueba estadistica para comparar dos poblaciones basada en muestras aleatorias inde¬ 
pendientes, la prueba de suma de rangos, fue propuesta por Frank Wilcoxon en 1945. De 
nuevo suponemos que estamos interesados en probar si las dos poblaciones tienen la misma 
distribution contra el desplazamiento (o localization) alternative (vease la Section 15.2). 
Supongamos que usted debe seleccionar muestras aleatorias independientes de n { y«, obser¬ 
vations de las poblaciones I y II, respectivamente. La idea de Wilcoxon era combinar las n l 
+ n 2 = n observaciones y clasificarlas, en orden de magnitud, de 1 (la mas pequena) a n (la 
mas grande). Los empates se tratan como en la Section 15.4. Esto es, si dos o mas observacio¬ 
nes estan empatadas para el mismo rango, el promedio de los rangos que se hubiera asignado 
a estas observaciones se asigna a cada miembro del grupo empatado. Si las observaciones se 
seleccionaron de poblaciones identicas, las sumas de rango para las muestras deben ser mas o 
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menos proporcionales a los tamanos muestrales n [ y n 2 . Por ejemplo, si n ] y n 7 fueran iguales, 
se esperaria que las sumas de rango fueran casi iguales. En contraste, si las observaciones en 
una poblacion, la I por ejemplo, tendfan a ser mayores que las de la poblacion II, las obser¬ 
vaciones de la muestra I tenderfan a recibir las clasificaciones mas altas y la muestra I tendrfa 
una suma de rango mayor que lo esperado. Entonces (con los tamanos muestrales siendo 
iguales), si una suma de rango es muy grande (y, de modo correspondiente, la otra es muy 
pequena), esto puede indicar una diferencia importante, desde el punto de vista estadfstico, 
entre las localizaciones de las dos poblaciones. 

Mann y Whitney propusieron en 1947 una prueba estadfstica equivalente que tambien em- 
pleaba sumas de rango para dos muestras. Como la prueba U de Mann-Whitney y las tablas de 
valores crfticos de U se presentan con tanta frecuencia en la literatura, explicaremos su uso en 
la Seccion 15.6 y daremos varios ejemplos de sus aplicaciones. En esta seccion ilustramos la 
logica de la prueba de la suma de rango y demostramos como determinar la region de rechazo 
para la prueba y el valor de a. 


EJEMPLO 15.4 La cantidad de bacterias por unidad de volumen se muestran en la Tabla 15.3 para dos tipos 
de cultivos, I y II; se hicieron cuatro observaciones para cada cultivo. Con n [ y n 2 represente 
el numero de observaciones en las muestras I y II, respectivamente. 

Para los datos dados en la Tabla 15.3, los rangos correspondientes se muestran en la Tabla 
15.4. ^Estos datos presentan suficiente evidencia para indicar una diferencia en la localization 
de las distribuciones poblacionales para los cultivos I y II? 


Tabla 15.3 

Datos para el Ejemplo 15.4 

I 

a 

27 

32 

31 

29 

26 

35 

25 

28 


Solution Sea W igual a la suma de rango para la muestra I (para esta muestra, W = 12). Ciertamente, 
valores muy pequenos o muy grandes de W dan evidencia para indicar una diferencia entre las 
localizaciones de las dos distribuciones poblacionales; de aquf que W, la suma de rango, se 
pueda emplear como estadfstico de prueba. 

La region de rechazo para una prueba determinada se obtiene en la misma forma que para 
la prueba de signos. Empezamos por seleccionar los valores de W mas contradictorios como la 
region de rechazo y sumamos estos hasta que a sea de tamano aceptable. 


Tabla 15.4 Rangos 

i 

II 

3 

7 

6 

5 

2 

8 

1 

4 

Suma de rango 12 

24 
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La suma de rangos minima incluye los rangos 1, 2, 3, 4 o W = 10. Del mismo modo, la 
maxima incluye los rangos 5, 6, 7, 8, con W = 26. Por tanto, incluimos estos dos valores de 
W en la region de rechazo. ^Cual es el valor correspondiente de a? 

Hallar el valor de a es un problema de probabilidad que se puede resolver usando los 
metodos del Capftulo 2. Si las poblaciones son identicas, toda permutation de los 8 rangos 
representa un punto muestral y es igualmente probable. Entonces, a es la suma de las proba- 
bilidades de los mismos puntos (arreglos) que implican W = 10 o W = 26. LI numero total de 
permutaciones de los ocho rangos es 8! El numero de arreglos diferentes de los rangos 1, 2, 
3, 4 en la muestra I con los 5, 6, 7, 8 de la muestra II es 4! X 4!. De igual manera, el numero 
de arreglos que ponen el valor maximo de W en la muestra I (rangos 5, 6, 7, 8) es 4! X 4!. 
Entonces, la probabilidad de que W= 10 o W= 26 es 


p(10) +p(26) 


(2)(4!)(4!) 

8 ! 


2 

G) 


i 

35 


.029. 


Si este valor de a es demasiado pequeno, la region de rechazo se puede agrandar para in- 
cluir las siguientes sumas de rangos mas pequena y mas grande, W = I I y W = 25. La suma 
de rango W = 11 incluye los rangos 1, 2, 3, 5, y 


P(H) 


4! 4! 

~8T 


1 

70' 


Del mismo modo. 


P( 25) 


1 

70 ' 


Entonces, 


a = p(10) + p( 11) + p (25) + p (26) 


2 

35 


.057. 


La expansion de la region de rechazo para incluir 12 y 24 aumenta considerablemente el valor 
de a. El conjunto de puntos muestrales que da un rango de 12 incluye todos los puntos mues- 
trales asociados con clasificaciones de (1, 2, 3, 6) y (1, 2, 4, 5). Asf, 


P (12) 


(2)(4!)(4!) 

8 ! 


1 

35’ 


y 


a = p(10) + p(ll) + p( 12) + p( 24) + p(25) + p( 26) 

1111114 
— — + — + — + — + — + — — — — .114. 

70 70 35 35 70 70 35 


Este valor de a podrfa ser considerado demasiado grande para fines practicos. Por tanto, esta- 
mos mas satisfechos con la region de rechazo W = 10, 11, 25 y 26. 

La suma de rangos para la muestra, W = 12, no cae en esta region de rechazo preferida, 
de modo que no tenemos evidencia suficiente para rechazar la hipotesis de que las distribu¬ 
ciones poblacionales de la cantidad de bacterias para los dos cultivos sean identicas. ■ 
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15.6 Prueba U de Mann-Whitney: 

muestras aleatorias independientes 

El estadfstico U de Mann-Whitney se obtiene al ordenar todas las (n l + n 2 ) observaciones 
segun su magnitud y al contar el numero de observaciones en la muestra I que precede a cada 
observacion de la muestra II. El estadfstico U es la suma de estas cantidades. En el resto de 
esta seccion denotamos las observaciones en la muestra I como x h x 2 , .. ., x n y las observa¬ 
ciones en la muestra II como y x , y 2 , ■ ■ ■, 

Por ejemplo, las ocho observaciones ordenadas del Ejemplo 15.4 son 

25 26 27 28 29 31 32 35 

x (l) *(2) *(3) 7(1) 7(2) X(4) 7(3) 7(4) 

La observacion y mas pequena es y (1) = 28, y la preceden u, = 3 de la muestra x. Del mis- 
mo modo, n 7 = 3 observaciones de las x preceden a y (2) = 29 y u 3 = 4, y n 4 = 4 observaciones 
de las x preceden a y (3) = 32 y y M) = 35, respectivamente, Entonces, 

U = ii\ +M2"Em3+M4 = 3+ 3+ 44-4 = 14. 

Valores muy grandes o muy pequenos de U implican una separation de las x y las y orde¬ 
nadas, en consecuencia demuestran que existe una diferencia (un desplazamiento de localiza¬ 
tion) entre las distribuciones de las poblaciones I y II. 

Como se indica en la Seccion 15.5, el estadfstico U de Mann-Whitney esta relacionado con 
la suma de rangos de Wilcoxon. De hecho, se puede demostrar (Ejercicio 15.75) que 


Formula para el estadfstico U de Mann-Whitney 


U = «i«2 + 


«l(»l + 1) 
2 


- W, 


donde n 1 = numero de observaciones en la muestra I, 
n 2 = numero de observaciones en la muestra II, 
W = suma de rango para la muestra I. 


Como se puede ver de la formula para U, U es pequena cuando W es grande, lo que es 
probable que ocurra cuando la distribucion de la poblacion I se desplaza a la derecha de la 
distribution de la poblacion II. En consecuencia, para realizar una prueba de una cola para 
detectar un desplazamiento en la distribucion de la poblacion I a la derecha de la distribucion 
de la poblacion II, usted rechazara la hipotesis nula de no diferencia en las distribuciones po- 
blacionales si C < U 0 , donde a = P(U < U 0 ) es de tamano apropiado. 

Algunos resultados utiles acerca de la distribucion de U: 

1. Los posibles valores de U son 0, 1, 2,..., «jn 2 . 

2. La distribucion de U es simetrica alrededor de (n^n 2 )/2. Esto es, para cualquier a > 0, 
P[U ' (ni«2)/2 — a] = P[U ' («!«2)/2 + a]. 

3. El resultado en (2) implica que P(U < Uq ) = P(U > n \ n 2 — Uq). 

Si se desea realizar una prueba de una cola para detectar un desplazamiento en la distribucion 
de la poblacion I a la izquierda de la distribucion de la poblacion II, se rechazarfa H 0 si U es muy 
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grande, especfficamente si U > n { n 2 - U 0 , donde U 0 es tal que a = P{U > /;,« 2 - U 0 ) = P(U 
< L/ 0 ) es de tamano aceptable. 

La Tabla 8, Apendice 3, proporciona la probabilidad de que un valor observado de U sea 
menor que varios valores, U 0 . Este es el valor de a para una prueba de una cola. Para realizar 
una prueba de dos colas, es decir, para detectar diferencia en las localizaciones de las pobla- 
ciones I y II, rechazar H 0 si U < t/ 0 o l/> npi 2 — U 0 , donde P(U < U 0 ) = a/2. 

Para saber como localizar la region de rechazo para la prueba U de Mann-Whitney, supon- 
ga que n Y = 4 y n 2 = 5. Entonces, se consultarfa la tercera seccion de la Tabla 8, Apendice 3 
(la correspondiente a n 2 = 5). Observe que la tabla esta construida suponiendo que n l < n 2 . 
Esto es, usted debe identificar siempre la muestra mas pequena como muestra I. De la tabla 
vemos, por ejemplo, P(U <2)= .0317 y P(U < 3) = .0556. Por tanto, si se desea realizar 
una prueba U de Mann-Whitney de cola inferior con n l = 4 y n 2 = 5 para a cercana a .05, se 
debe rechazar la hipotesis nula de igualdad de distribuciones de frecuencia relativa poblacio- 
nal cuando U < 3. La probabilidad de un error tipo I para la prueba es a = .0556. 

Cuando se aplique la prueba a un conjunto de datos, es posible hallar que algunas de las 
observaciones son de igual valor. Los empates en las observaciones se pueden manejar al pro- 
mediar los rangos que se hubieran asignado a las observaciones empatadas y asignar este 
promedio a cada una. De este modo, si tres observaciones estan empatadas y han de recibir 
rangos 3, 4 y 5, asignamos el rango 4 a todas ellas. La siguiente observation de la secuencia 
recibe rango 6 y los rangos 3 y 5 no aparecen. De manera similar, si dos observaciones estan 
empatadas para los rangos 3 y 4, cada una recibe rangos 3.5 y los rango 3 y 4 no aparecen. 

La Tabla 8, Apendice 3, se puede usar tambien para hallar el nivel de significancia obser¬ 
vado para una prueba. Por ejemplo, si n, = 5, n 2 = 5 y U = 4, el valor p para una prueba de 
una cola de que la distribucion de la poblacion I se desplaza a la derecha de la distribucion 
de la poblacion II es 


P{t/< 4} = .0476. 


Si la prueba es de dos colas, el valor p es 

2(.0476), o sea .0952. 


La prueba U de Mann-Whitney 

La poblacion I es la poblacion de la cual se tomo la muestra mas pequena. 

Hipotesis nula: H 0 : las distribuciones de las poblaciones I y II son identicas. 
Hipotesis alternativa: (1) H a : las distribuciones de las poblaciones I y II tienen loca¬ 
lizaciones diferentes (una prueba de dos colas), 

o bien, (2) la distribucion de la poblacion I se desplaza a la derecha de la distribucion 
de la poblacion II, o (3) la distribucion de la poblacion I se desplaza a la izquierda de 
la distribucion de la poblacion II. 

Estadfstico de prueba: U = + l)]/2 — W. 

Region de rechazo: (1) para la prueba de dos colas y un valor dado de a, rechazar H 0 
si (/ < U t) o (7 > n t n n — U 0 , donde P(U < U 0 ) = aj2. [Nota: observe que U 0 es el 
valor tal que P{U < U 0 ) es igual a la mitad de a.] 

(2) Para probar que la poblacion I esta desplazada a la derecha de la poblacion II 
con un valor determinado de a, rechazar H 0 si U s U 0 , donde P(U < U 0 ) = a. 



760 CapTtuIo 15 


Estadfstica no parametrica 


(3) Para probar que la poblacion I esta desplazada a la izquierda de la poblacion II 
con un valor determinado de a , rechazar H 0 si L > n { n 2 — U 0 , donde P(U < U 0 ) 
= a. 

Suposiciones: las muestras se han seleccionado aleatoriamente y de manera indepen- 
diente de sus poblaciones respectivas. Los empates en las observaciones se pueden 
manejar al promediar los rangos que hubieran sido asignados a las observaciones 
empatadas y asignar este rango promedio a cada una. Asl, si tres observaciones estan 
empatadas y han de recibir rangos 3, 4 y 5, asignamos un rango 4 a todas ellas. 


EJEMPLO 15.5 


Pruebe la hipotesis de que no hay diferencia en las localizaciones de las distribuciones pobla- 
cionales para los datos de la cantidad de bacterias del Ejemplo 15.4. 


Solucion Ya hemos indicado que la prueba U de Mann-Whitney y la prueba de suma de rangos de 
Wilcoxon son equivalentes, de modo que deberfamos llegar a las mismas conclusiones aquf al 
igual que en el Ejemplo 15.4. Recuerde que la hipotesis alternativa era que las distribuciones 
de cantidades de bacterias para los cultivos I y II diferfan y que esto implicaba una prueba de 
las dos colas. Asl, como la Tabla 8, Apendice 3, da valores de P(U < U 0 ) para tamanos 
muestrales especificados y valores de U 0 , debemos duplicar el valor tabulado para hallar a. 
Suponga, como en el Ejemplo 15.4, que deseamos un valor de a cercano a .05. Verificando la 
Tabla 8 para ver n l = n 2 = 4, encontramos P(U < 1) = .0286. La region de rechazo apropia- 
da para la prueba de dos colas es 1/ s 1 o 1/ > n,n 2 — 1 = 16 — 1 = 15, para lo cual a = 
2(.0286) = .0572 o bien, redondeando a tres lugares decimales, a = .057 (el mismo valor de 
a obtenido para el Ejemplo 15.4). 

Para los datos de las bacterias, la suma de rango es W = 12. Entonces, 


+ 1) 4(4 -E 1 ) 

U = n i «2 + -- - W = (4)(4) + —-- - 12 = 14 . 


El valor calculado de U no cae en la region de rechazo. En consecuencia, no hay suficiente evi- 
dencia para demostrar una diferencia en las localizaciones de las distribuciones poblacionales 
de la cantidad de bacterias para los cultivos I y II. El valor p se da con 2 P(U > 14) = 2P(U 
< 2) = 2(.0571) = .1142. ■ 


EJEMPLO 15.6 Se realizo un experimento para comparar las resistencias de dos tipos de papeles de estraza, 
un papel estandar de un peso especificado y el otro del mismo papel estandar tratado con una 
sustancia qulmica. Diez piezas de cada tipo de papel, seleccionadas aleatoriamente de un lote, 
produjeron las mediciones de resistencia que se muestran en la Tabla 15.5. Pruebe la hipotesis 
de que no hay diferencia en las distribuciones de resistencias para los dos tipos de papel, con¬ 
tra la hipotesis alternativa de que el papel tratado tiende a ser mas fuerte. 

Solucion Ambas muestras son de tamano 10, de modo que cada poblacion (estandar o tratada) puede 
ser designada como poblacion I. Hemos identihcado las mediciones de papel estandar como 
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Tabla 15.5 Dalos para el Ejemplo 15.6 


Estandar, 1 

Tratado, II 

1.21 (2) 

1.49(15) 

1.43 (12) 

1.37 (7.5) 

1.35 (6) 

1.67 (20) 

1.51 (17) 

1.50 (16) 

1.39 (9) 

1.31 (5) 

1.17(1) 

1.29 (3.5) 

1.48 (14) 

1.52 (18) 

1.42 (11) 

1.37 (7.5) 

1.29 (3.5) 

1.44(13) 

1.40 (10) 

1.53 (19) 

Suma de rangos W = 85.5 


provenientes de la poblacion I. En la Tabla 15.5 los rangos se muestran entre parentesis junto 
a las n l + n 2 = 10 + 10 = 20 mediciones de resistencia y la suma de rangos W aparece de- 
bajo de la primera columna. Como deseamos detectar un desplazamiento en la distribucion 
de la poblacion I (estandar) a la izquierda de la distribucion de la poblacion II (tratada), re- 
chazaremos la hipotesis nula de que no hay diferencia en las distribuciones poblacionales de 
resistencia cuando W es excesivamente pequena. Debido a que esta situacion ocurre cuando 
U es grande, realizaremos una prueba estadistica de una cola y rechazaremos la hipotesis nula 
cuando U > n , n 2 — U 0 . 

Supongase que escogemos un valor de a cercano a .05. Entonces podemos hallar U 0 al 
consultar la parte de la Tabla 8, Apendice 3, correspondiente a n 2 = 10. La probabilidad 
P(U < U 0 ) cercana a .05 es .0526 y corresponde a U 0 = 28. Por tanto, rechazaremos si 
[/> (10)(10) - 28 = 72. 

Al calcular U, tenemos 


n i (n i +11 


Como se puede ver, U no es mayor que 72. Por tanto, no podemos rechazar la hipotesis 
nula. En el nivel de significancia a = .0526, no hay suficiente evidencia para indicar que 
el papel de estraza tratado sea mas fuerte que el estandar. El valor p esta dado por P(JJ s 
69.5) = P(t/< 30.5) = .0716. ■ 


Una prueba simplihcada para muestras grandes («, > 10 y n 2 > 10) se puede obtener con 
el uso del ya conocido estadlstico Z del Capltulo 10. Cuando las distribuciones poblacionales 
son identicas, se puede demostrar que el estadlstico U tiene los siguientes valor y varianza 
esperados: 


iitiij rt\ni(ri\ + n? + 1) 

E(U) = y V(U) = - y * 12 - --. 


z = 


U — E{U ) 

UU 


Tambien, cuando n, y son grandes, 
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tiene aproximadamente una distribucion normal estandar. Esta aproximacion es adecuada 
cuando n l y n 2 son ambos mayores o iguales a 10. Asl, para una prueba de dos colas con a = 
.05, rechazaremos la hipotesis nula si |z| > 1.96. 

El estadistico Z da la misma conclusion que la prueba U exacta para el Ejemplo 15.6: 


z = 


69.5 — [(10)( 10)/2] 
V[(10)(10)(10 + 10 + 1)]/12 
19.5 


13.23 


= 1.47. 


69.5 - 50 
V2100/12 


19.5 

VT75 


Para una prueba de una cola con a = .05 ubicada en la cola superior de la distribucion z, re¬ 
chazaremos la hipotesis nula si z > 1.645. Se puede ver que z = 1.47 no cae en la region de 
rechazo y que esta prueba llega a la misma conclusion que la prueba U exacta del Ejemplo 
15.6. 


La prueba U de Mann-Whitney para muestras grandes n 1 >10y/? 2 >10 

Hipotesis nula: H 0 : las distribuciones de frecuencia relativa para las poblaciones I 
y II son identicas. 

Hipotesis alternativa: (1) H a : las distribuciones de frecuencia relativa de las dos 
poblaciones difieren en ubicacion (una prueba de dos colas), 

o bien, (2) la distribucion de frecuencia relativa para la poblacion I esta desplazada a 
la derecha (o la izquierda) de la distribucion de frecuencia relativa para la poblacion 
II (una prueba de una cola). 

U — (nj«2/2) 

Estadistico de prueba : Z = — 

V«l«2(»l +«2 + 1)/12 

Region de rechazo: rechazar /7 0 si z > z a j 2 o z < ~z a / 2 para una prueba de dos co¬ 
las. 

Para una prueba de una cola, ponga toda a en una cola de la distribucion z. Para 
detectar un desplazamiento en la distribucion de la poblacion I a la derecha de la 
distribucion de la poblacion II, rechace H 0 cuando z <~z a - Para detectar un despla¬ 
zamiento en la direccion contraria, rechace H 0 cuando z, > z. n . Los valores tabulados 
de z se dan en la Tabla 4, Apendice 3. 


Puede parecer que la prueba U de Mann-Whitney y la prueba de suma de rangos de 
Wilcoxon equivalente no son muy eficientes porque no parece que usen toda la informa- 
cion de la muestra. En realidad, estudios teoricos han demostrado que este no es el caso. 
Supongamos, por ejemplo, que todas las suposiciones para una prueba t de dos muestras se 
satisfacen cuando se prueba H 0 : /jl 1 — ix 2 = 0 contra H a : /jl 1 — /jl 2 > 0. Como la prueba 1 de 
dos muestras simplemente prueba para hallar una diferencia en localizacion (vease la Seccion 
15.2), podemos usar el estadistico U de Mann-Whitney para probar estas mismas hipotesis. 
Para una a y /3 dadas, el tamano muestral total requerido para la prueba t es aproximadamente 
.95 multiplicado por el tamano muestral total requerido para la U de Mann-Whitney. Asl, el 
procedimiento no parametrico es casi tan bueno como la prueba t para la situacion en la que 
la prueba t es optima. Para muchas distribuciones no normales, el procedimiento no parame¬ 
trico requiere menos observaciones que un procedimiento parametrico correspondiente para 
producir los mismos valores de a y [3. 
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Ejercicios 

15.21 Encuentre los valores p asociados con cada una de las siguientes situaciones para probar H 0 \ las pobla- 
ciones I y II tienen la misma distribucion. 

a H a : la distribucion de la poblacion I se desplaza a la derecha de la distribucion de la poblacion II; n 1 
= 4, n 2 = 1,W= 34. 

b H a : la distribucion de la poblacion I se desplaza a la izquierda de la distribucion de la poblacion II; 
ti , =5,n 2 = 9, W = 38. 

c H a : las poblaciones I y II difieren en ubicacion; n l — 3, n 2 = 6, W = 23. 

15.22 En algunas pruebas de salud en ancianos, un nuevo medicamento ha mejorado la capacidad de memoria 
casi al nivel de los jovenes. El medicamento pronto se probara en pacientes con el mal de Alzheimer, 
enfermedad cerebral mortal que finalmente destruye las mentes de aquellos que estan afectados. De 
acuerdo con el doctor Gary Lynch de la Universidad de California en Irvine, el medicamento, llamado 
ampakino CX-516, acelera las senales entre celulas cerebrales y parece agudizar de manera significa- 
tiva la memoria. 3 En una prueba preliminar hecha en estudiantes que apenas rebasan los 20 anos y en 
hombres entre 65 y 70 anos, los resultados fueron particularmente sorprendentes. Los siguientes datos 
son los numeros de sflabas incoherentes recordadas despues de 5 minutos para diez hombres de 20 anos 
o mas y en diez hombres entre 65 y 70 anos a quienes se les dio una dosis muy pequena del ampakino 
CX-516. ^Los datos aportan suficiente evidencia para concluir que hay una diferencia en el numero de 
sflabas incoherentes recordadas por hombres de los dos grupos de edad cuando a los mas viejos se les 
dio el ampakino CX-516? Determine el valor p asociado. 


Gmpo de edad 

Numero de sflabas recordadas 

20 

11 7 6 

8 

6 

9 

2 

10 3 6 

65-70 

(con ampakino CX-516) 

1 9 6 

8 

7 

8 

5 

7 10 3 


15.23 Se probaron dos plasticos, cada uno de ellos producido por un proceso diferente, para hallar su resis- 
tencia maxima. Las mediciones de la siguiente tabla representan cargas de ruptura en unidades de 1000 
libras por pulgada cuadrada. ^Estos datos presentan evidencia de una diferencia entre las localizaciones 
de las distribuciones de resistencias maximas para los dos plasticos? Resuelva el problema usando la 
prueba U de Mann-Whitney con un nivel de significancia tan cercano como sea posible a a = 10. 


Plastico 1 

Plastico 2 

15.3 

21.2 

18.7 

22.4 

22.3 

18.3 

17.6 

19.3 

19.1 

17.1 

14.8 

27.7 


15.24 Los valores codificados para una medida de brillantez en papel (reflectividad ligera), elaborado por dos 
procesos diferentes, son como se muestra en la siguiente tabla para muestras de tarnano 9 obtenidas 
aleatoriamente de cada uno de los dos procesos. ^Estos datos presentan suficiente evidencia para indicar 
una diferencia en la localizacion de las mediciones de brillantez para los dos procesos? Proporcione el 
nivel de significancia alcanzado. 

3. Fuente: “Alzheimer's Test Set for New Memory Drug,” Press Enterprise (Riverside, Calif.), 18 de noviembre de 
1997, p. A-4 
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A 

B 

6.1 

9.1 

9.2 

8.2 

8.7 

8.6 

8.9 

6.9 

7.6 

7.5 

7.1 

7.9 

9.5 

8.3 

8.3 

7.8 

9.0 

8.9 


a Use la prueba U de Mann-Whitney, 
b Use la prueba t de Student. 

c Proporcione las hipotesis especfficas nula y alternativa, junto con cualesquiera suposiciones, para las 
pruebas empleadas en los incisos a y b. 

15.25 Se seleccionaron al azar 15 baterias experimentales de un lote de la planta piloto A y se seleccionaron 15 
baterias estandar de la production de la planta B. Las 30 baterias se colocaron simultaneamente bajo una 
carga electrica de la misma magnitud. La primera bateria en fallar fue una A, la segunda una B, la tercera 
una B y as! sucesivamente. La secuencia siguiente muestra el orden de falla para las 30 baterias: 

ABBBABAABBBBABA 

BBBBAABAAABAAAA 

Usando la teorfa de muestras grandes para la prueba U determine si hay suficiente evidencia para permi- 
tir que el experimentador concluya que la vida util para las baterias experimentales tiende a ser mayor 
que para las baterias estandar. Use a = .05. 

15.26 Consulte los Ejercicios 8.88 y 8.89. ,-Hay suficiente evidencia para indicar una diferencia en las po- 
blaciones de mediciones de LC50 para DDT y Diazinon? ^.Cual es el nivel de significancia alcanzado 
asociado con el estadfstico W. ^Que se concluye cuando a = .10? 

15.27 A continuation aparece una tabla que indica frecuencias de aletazos 4 para muestras de dos especies 
de abejas euglosinas. Cuatro abejas de la especie Euglossa mandibularis Friese y seis de la especie 
Euglossa imperialis Cockerell se muestran en la siguiente tabla. 


Frecuencias de aletazos 

E. mandibularis Friese 

E. imperialis Cockerell 

235 


180 

225 


169 

190 


180 

188 


185 



178 



183 


4. Fuente: T. M. Casey, M. L. May, and K. R. Morgan. "Flight Energetics of Euglossine Bees in Relation to Morpho¬ 
logy and Wing Stroke Frequency,” Journal of Experimental Biology 116 (1985). 
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a ^Los datos presentan suficiente evidencia para indicar que las distribuciones de frecuencias de aleta- 
zos difieren para las dos especies? Use la prueba basada en el estadfstico U de Mann-Whitney con a 
tan cercana a .10 como sea posible, pero sin rebasarlo. 
b De el valor p aproximado asociado con la prueba. 

28 El tratamiento de cancer con quimioterapia ernplea sustancias quimicas que matan celulas cancerosas 
y normales. En algunos casos la toxicidad del medicamento contra el cancer, es decir, su efecto en 
celulas normales, se puede reducir mediante la inyeccion simultanea de un segundo medicamento. 
Se realizo un estudio para determinar si la inyeccion de un medicamento particular era benefica para 
reducir los efectos perjudiciales de un tratamiento de quimioterapia en el tiempo de supervivencia 
para ratas. Dos grupos de ratas seleccionados aleatoriamente, 12 ratas en cada grupo, se emplearon para 
el experimento. Ambos grupos, llamados A y B, recibieron el medicamento toxico en una dosis lo 
suficientemente grande como para causar la muerte, pero el grupo B tambien recibio la antitoxina 
que estaba destinada a reducir el efecto toxico de la quimioterapia en celulas normales. La prueba 
se concluyo al termino de 20 dias o 480 horas. Los tiempos de supervivencia para los dos grupos 
de ratas, a las 4 horas mas cercanas, se muestran en la siguiente tabla. ^.Los datos arrojan evidencia 
suficiente para indicar que las ratas que recibieron la antitoxina tendian a vivir mas despues de la qui¬ 
mioterapia que las que no la recibieron? Use la prueba U de Mann-Whitney con un valor de a cercano 
a.05. 


Solo quimioterapia (A) 

Quimioterapia mas medicamento (B) 

84 

140 

128 

184 

168 

368 

92 

96 

184 

480 

92 

188 

76 

480 

104 

244 

72 

440 

180 

380 

144 

480 

120 

196 


7 La prueba de Kruskal-Wallis para 
un diseno de un factor 

En la Seccion 13.3 presentamos un analisis de procedimiento de varianza (ANOVA) para 
comparar las medias de k poblaciones. La prueba F resultante estuvo basada en la suposicion 
de que muestras aleatorias independientes se tomaron de poblaciones normales con varianzas 
iguales. Esto es, como dijimos en la Seccion 15.2, estabamos interesados en probar si todas 
las poblaciones tenfan la misma distribucion contra la alternativa de que las poblaciones di- 
ferfan en localizacion. Un elemento clave en el desarrollo del procedimiento era la cantidad 
identificada como la suma de cuadrados del tratamiento, SST. Como seiialamos en el analisis 
de la Seccion 13.3, cuanto mayor fuera el valor de la SST mayor serfa el peso de la evidencia 
para rechazar la hipotesis nula de que las medias son todas iguales. En esta seccion presen¬ 
tamos una tecnica no parametrica para probar si las poblaciones difieren en localizacion. Al 
igual que las otras tecnicas no parametricas analizadas en este capftulo, el procedimiento 
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de Kruskal-Wallis no requiere suposiciones acerca de la forma real de las distribuciones de 
probabilidad. 

Como en la Seccion 13.3 suponemos que muestras aleatorias independientes han sido to- 
madas de k poblaciones que difieren solo en localizacion, aunque no es necesario suponer que 
estas poblaciones poseen distribuciones normales. Para una generalization completa, permiti- 
mos que los tamanos muestrales sean desiguales y con n ; , para i = 1,2 ,k, representamos 
el tamano de la muestra tomada de la i-esima poblacion. Igual que en el procedimiento de la 
Seccion 15.5, combinamos todas las n l + «, + •• • + n k = n observaciones y las clasificamos 
desde 1 (la mas pequena) hasta n (la mas grande). Los empates se tratan como en las secciones 
previas. Esto es, si dos o mas observaciones estan empatadas para el mismo rango, entonces 
el promedio de los rangos que se hubieran asignado a estas observaciones se asigna a cada 
miembro del grupo empatado. Con R i denotamos la suma de los rangos de las observaciones 
de la poblacion i y con R, = R, /n, denotamos el promedio correspondiente de los rangos. Si 
R es igual al promedio general de todos los rangos, consideramos el rango analogo SST, que 
se calcula usando los rangos en lugar de los valores reales de las mediciones: 


k 


V = £«,■(/?,■ -/?) 2 . 


Si la hipotesis nula es verdadera y las poblaciones no difieren en localizacion, esperariamos 
que los valores Rj fueran aproximadamente iguales y el valor resultante de V fuera relativa- 
mente pequeno. Si la hipotesis alternativa es verdadera, esperariamos que esto se refleje en 
las diferencias entre los valores de R t que llevan a un valor grande para V. Observe que R = 
(suma de los primeros n enteros)/« = [n(n + l)/2]/n = (n + l)/2 y que 



En lugar de concentrarse en V, Kruskal y Wallis (1952) consideraron el estadfstico H = 12V 7 / 
[n(n + 1)], que se puede reescribir (vease el Ejercicio 15.35) como 


n k r>2 



Como ya antes dijimos, la hipotesis nula de localizaciones iguales es rechazada a favor de la 
alternativa de que las poblaciones difieren en localizacion si el valor de H es grande. Asf, 
la correspondiente prueba de nivel a pide el rechazo de la hipotesis nula a favor de la alterna¬ 
tiva si H > h(a), donde h(a) es tal que, cuando H 0 es verdadera, P[H> h(a)\ = a. 

Si las distribuciones subyacentes son continuas y si no hay empates entre las n observa¬ 
ciones, la distribution nula de H puede hallarse (tediosamente) con el uso de los metodos del 
Capitulo 2. Podemos hallar la distribution de //para cualesquiera valores de k y n v n 2 ,..., n k 
al calcular el valor de H para cada una de las n ! igualmente probables permutaciones de los 
rangos de las n observaciones (vea el Ejercicio 15.36). Estos calculos se han efectuado ya y se 
han desarrollado tablas para algunos valores relativamente pequenos de k y para n v n 2 ,..., n k 
[vea, por ejemplo, la Tabla A. 12 de Hollander y Wolfe (1999)]. 

Kruskal y Wallis demostraron que si los n i valores son “grandes”, la distribution nula 
de H se puede aproximar con una distribution \ 2 con k — \ grados de libertad (gl). Este 
calculo se acepta generalmente como adecuado si cada uno de los n j valores es mayor o 
igual a 5. Nuestros ejemplos y ejercicios son tales que esta aproximacion de muestra gran- 
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EJEMPLO 15.7 


Solucion 


de es adecuado. Si listed desea usar el analisis de Kruskal-Wallis para conjuntos de datos 
mas pequenos, donde esta aproximacion para muestras grandes no es adecuada, consulte la 
obra de Hollander y Wolfe (1999) para obtener los valores crfticos apropiados. 

Resumimos el procedimiento de Kruskal-Wallis basada para muestrar grandes como sigue. 


Prueba de Kruskal-Wallis basada en H para comparar k distribuciones 
poblacionales 

Hipotesis nula: H 0 : las k distribuciones poblacionales son identicas. 

Hipotesis alternativa: H a \ al menos dos de las distribuciones poblacionales difieren 
en localizacion. 

k 

Estadfstico de prueba: H = {12 /[n(n + 1)]}^^— 3 (n + 1), donde 

i =1 

n i = niimero de mediciones en la muestra de la poblacion i, 

R t = suma de rangos para la muestra i, donde el rango de cada medida se calcula de 
acuerdo con su tamano relativo en el conjunto general de n = n k + n 2 + • • • + n k 
observaciones formadas al combinar los datos de todas las k muestras. 

Region de rechazo: rechazar H 0 si H > con (k — 1) grados de libertad. 

Suposiciones: las k muestras se sacan al azar y en forma independiente. Hay cinco o 
mas mediciones en cada muestra. 


Un ingeniero de control de calidad ha seleccionado muestras independientes de la produccion 
de tres lfneas de ensamble en una planta de componentes electronicos. Para cada lrnea, la pro¬ 
duccion de diez horas seleccionadas al azar se examino en busca de defectos. (Los datos de 
la Tabla 15.6 dan evidencia de que las distribuciones de probabilidad del numero de defectos 
por hora de produccion difieren en localizacion para al menos dos de las lfneas? Use a = .05. 
Tambien proporcione el valor p asociado con la prueba. 

En este caso, n { = 

H 


Tabla 15.6 Datos para el Ejemplo 15.7 


Lrnea 1 

Lrnea 2 

Lrnea 3 

Defectos 

Rango 

Defectos 

Rango 

Defectos 

Rango 

6 

5 

34 

25 

13 

9.5 

38 

27 

28 

19 

35 

26 

3 

2 

42 

30 

19 

15 

17 

13 

13 

9.5 

4 

3 

11 

8 

40 

29 

29 

20 

30 

21 

31 

22 

0 

1 

15 

11 

9 

7 

7 

6 

16 

12 

32 

23 

33 

24 

25 

17 

39 

28 

18 

14 

5 

4 

27 

18 

24 

16 

Ri = 120 

R 2 = 210.5 

Ri = 134.5 


10 = n 2 = « 3 y n = 30. Asf, 
12 


30(31) 


(120) 2 (210.5) 2 (134.5) 2 " 1 


10 


10 


10 


3(31) = 6.097. 
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Debido a que todos los valores n t son may ores o iguales a 5, podemos usar la aproxima- 
cion para la distribution nula dc H y rechazar la hipotesis nula de iguales localizaciones si 
H > Xa con base en k — 1 =2 grados de libertad. Consultamos la Tabla 6 , Apendice 3, para 
determinar que x 05 = 5.99147. Por tanto, rechazamos la hipotesis nula en el nivel a = .05 y 
concluimos que al menos una de las tres lmeas tiende a producir un numero mayor de piezas 
defectuosas que las otras. 

De acuerdo con la Tabla 6 , Apendice 3, el valor de H = 6.097 lleva al rechazo de la hipo¬ 
tesis nula si a = .05 pero no si a = .025. Entonces, .025 < valor p < .05. La aplicacion Chi- 
Square Probability and Quantiles se puede usar para establecer que el valor p aproximado es 
igual a P(x 2 > 6.097) = .0474. ■ 


Se puede demostrar que si deseamos comparar solo k = 2 poblaciones, la prueba de 
Kruskal-Wallis es equivalente a la prueba bilateral de Wilcoxon de suma de rangos presen- 
tada en la Section 15.5. Si se obtienen datos de un diseno de un factor que comprenda k > 2 
poblaciones pero deseamos comparar un par de poblaciones en particular, la prueba de suma 
de rangos de Wilcoxon (o la prueba equivalente U de Mann-Whitney de la Section 15.6) se 
puede usar para este fin. Observe que el analisis basado en el estadfstico H de Kruskal-Wallis 
no requiere el conocimiento de los valores reales de las observaciones. Solo es necesario co- 
nocer los rangos de las observaciones para completar el analisis. El Ejercicio 15.32 ilustra el 
uso del analisis de Kruskal-Wallis para tal caso. 


Ejercicios 

15.29 La siguiente tabla contiene information sobre la longitud de las hojas de plantas de la misma especie 
en cada uno de cuatro lugares pantanosos no urbanizados. En cada uno de estos, se seleccionaron alea- 
toriamente seis plantas. Se seleccionaron al azar diez hojas de cada una de las plantas y la media de las 
diez mediciones (en centimetres) se registro para cada planta de cada uno de los lugares. Use la prueba 
H de Kruskal-Wallis para determinar si hay suficiente evidencia para afirmar que la distribution de las 
longitudes medias de las hojas difiere en localizaciones para al menos dos de los sitios. Use a = .05. 
Establezca el llmite o encuentre el valor p aproximado. 


Localization Longitud media de la hoja (cm) 


1 

5.7 

6.3 

6.1 

6.0 

5.8 

6.2 

2 

6.2 

5.3 

5.7 

6.0 

5.2 

5.5 

3 

5.4 

5.0 

6.0 

5.6 

4.0 

5.2 

4 

3.7 

3.2 

3.9 

4.0 

3.5 

3.6 


15.30 Una compafua piensa promover un nuevo producto mediante el uso de una de tres campanas publi- 
citarias. Para investigar la magnitud del reconocimiento del producto que resulte de las campanas, se 
seleccionaron 15 areas de mercado y a cada 5 se les asigno aleatoriamente una campana. Al final de 
las campanas se seleccionaron muestras aleatorias de 400 adultos en cada area y las proporciones de 
quienes indicaron familiaridad con el producto aparecen en la siguiente tabla. 
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Campana 

1 

2 

3 

.33 

.28 

.21 

.29 

.41 

.30 

.21 

.34 

.26 

.32 

.39 

.33 

.25 

.27 

.31 


a ^,Que tipo de diseno experimental se utilizo? 

b ^Hay suficiente evidencia para indicar la diferencia en ubicaciones de las distribuciones de califica- 
ciones de reconocimiento de producto para las tres campanas? Establezca el lfmite o de el valor de p 
aproximado. 

c Las campanas 2 y 3 fueron, respectivamente, las mas y menos costosas. ^Hay suficiente evidencia 
para indicar que la campana 2 es mas exitosa que la campana 3? Pruebe usando el procedimiento U 
de Mann-Whitney. Proporcione el valor p asociado. 

15.31 Tres diferentes marcas de tubos magnetron (componentes clave en homos de microondas) fueron some- 
tidas a pruebas de esfuerzo, registrandose el numero de horas que cada uno de ellos opero sin necesidad 
de reparacion (vease la tabla siguiente). Aunque estos tiempos no representan tiempos de vida util tipi- 
cos, indican lo bien que estos tubos pueden resistir esfuerzos extremos. 


Marca A 

Marca B 

Marca C 

36 

49 

71 

48 

33 

31 

5 

60 

140 

67 

2 

59 

53 

55 

42 


a Use la prueba F para un diseno de un factor (Capftulo 13) para probar la hipotesis de que la duracion 
media con esfuerzo es igual para las tres marcas. Use a = .05. ^Que suposiciones son necesarias para 
la validez de este procedimiento? ^Hay alguna razon para dudar de estas suposiciones? 
b Use la prueba Rruskal-Wallis para determinar si existe evidencia para concluir que las marcas de 
tubos magnetron tienden a diferir en duracion con esfuerzo. Pruebe usando a = .05. 

15.32 Se realizo un experimento para comparer el tiempo que una persona tarda en recuperarse de cada uno 
de los tres tipos de gripe, Victoria A, Texas y Rusa. Veintiun personas fueron seleccionadas aleatoria- 
mente de un grupo de voluntaries y divididas en tres grupos de 7 cada uno. A cada grupo se le asigno al 
azar una variedad del virus y la gripe fue inducida en las personas, todas las cuales recibieron atencion 
medica en condiciones identicas y se registro el tiempo de recuperacion (en dfas). Los rangos de los 
resultados aparecen en la siguiente tabla. 


Victoria A 

Texas 

Rusa 

20 

14.5 

9 

6.5 

16.5 

1 

21 

4.5 

9 

16.5 

2.5 

4.5 

12 

14.5 

6.5 

18.5 

12 

2.5 

9 

18.5 

12 
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a ^Los datos aportan suficiente evidencia para indicar que los tiempos de recuperacion para uno (o mas) 
tipo(s) de gripe tiende(n) a ser mas largos que para los otros tipos? Proporcione el valor p asociado. 
b ^Los datos aportan suficiente evidencia para indicar una diferencia en las localizaciones de las distribu- 
ciones de tiempos de recuperacion para los tipos Victoria A y Rusa? Proporcione el valor p asociado. 

15.33 La EPA desea determinar si los cambios de temperatura en el agua de mar causados por una planta nu¬ 
clear para generar energfa electrica, tendran un efecto importante en la fauna de la region. Recientemente, 
especfmenes recien nacidos de ciertos peces se han dividido aleatoriamente en cuatro grupos que se 
colocan en ambientes oceanicos simulados y separados que son identicos en todo excepto en la tempe¬ 
rature del agua. Seis meses despues se pesan los especfmenes y los resultados (en onzas) se dan en la 
siguiente tabla. ^Los datos arrojan suficiente evidencia para indicar que una (o mas) de las temperatures 
tiende a producir aumentos de peso mayores que las otras temperatures? Pruebe usando a = .10. 


Pesos de especfmenes 

38°F 

42°F 

46°F 

50°F 

22 

15 

14 

17 

24 

21 

28 

18 

16 

26 

21 

13 

18 

16 

19 

20 

19 

25 

24 

21 


17 

23 



15.34 Cada ano los gorgojos ocasionan perdidas de millones de dolares en las cosechas de algodon. Se aplican 
tres sustancias qufmicas disenadas para controlar las poblaciones de gorgojos. Despues de 3 meses, diez 
lotes de igual tamano se seleccionan aleatoriamente dentro de cada campo y, para cada uno, se registra 
el porcentaje de plantas de algodon danadas por los gorgojos. ^Los datos de la siguiente tabla aportan 
suficiente evidencia para indicar una diferencia en la localization entre las distribuciones de porcentajes 
de danos correspondientes a los tres tratamientos? Establezca lfmites para el valor p asociado. 


Sustancia 
qufmica A 

Sustancia 
qufmica B 

Sustancia 
qufmica C 

10.8 

22.3 

9.8 

15.6 

19.5 

12.3 

19.2 

18.6 

16.2 

17.9 

24.3 

14.1 

18.3 

19.9 

15.3 

9.8 

20.4 

10.8 

16.7 

23.6 

12.2 

19.0 

21.2 

17.3 

20.3 

19.8 

15.1 

19.4 

22.6 

11.3 


15.35 


El estadfstico de Kruskal-Wallis es 


H = 


12 

n(n + 1) 





Efectue la operation indicada de elevar al cuadrado cada termino de la suma y, ademas, sume los valores 
resultantes para demostrar que 


H = 


12 

n{n + 1) 


E 


Rf 

-3(n + 1). 
n, 


[Sugerencia: recuerde que R, = R,/rc,- y que = suma de los primeros n enteros = n(n + 

l)/2.] 
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15.36 


15.8 


En la Section 12.4 estudiamos los meritos de un diseno de bloques aleatorizado para un 
experimento que compara el rendimiento de varios tratamientos. Suponemos que b bloques 
se emplean en el experimento, que esta disenado para comparar las localizaciones de las dis- 
tribuciones de las respuestas correspondientes a cada uno de k tratamientos. El ANOVA, que 
estudiamos en la Section 13.9, estuvo basado en las suposiciones de que las observaciones en 
cada combination de bloque-tratamiento estuvieron distribuidas normalmente con varianzas 
iguales. A1 igual que en el caso del diseno de un factor, la SST fue la cantidad clave en el 
analisis. 

La prueba de Friedman, inventada por Milton Friedman (1937), economista ganador del 
premio Nobel, esta disenada para probar la hipotesis nula de que las distribuciones de pro- 
babilidad de los k tratamientos son identicas contra la alternativa de que al menos dos de las 
distribuciones difieren en localization. La prueba esta basada en un estadfstico equivalente en 
rangos a la SST para el diseno de bloques aleatorizado (vea la Section 13.9) y se calcula en la 
siguiente forma. Despues de obtener los datos de un diseno de bloques aleatorizado, dentro 
de cada bloque los valores observados de las respuestas a cada uno de los k tratamientos se 
clasifican de 1 (el mas pequeno del bloque) a k (el mas grande del bloque). Si dos o mas ob¬ 
servaciones del mismo bloque estan empatadas para el mismo rango, entonces el promedio de 
los rangos que se hubieran asignado a estas observaciones se asigna a cada miembro del grupo 
empatado. No obstante, los empates necesitan resolverse de este modo solo si se presentan 
dentro del mismo bloque. 

Con Rj denote la suma de los rangos de las observaciones correspondientes al tratamiento 
; y con R, = R-,jb denote el promedio correspondiente de los rangos (recuerde que, en un 
diseno de bloques aleatorizado, cada tratamiento se aplica exactamente una vez en cada blo¬ 
que, resultando en un total de b observaciones por tratamiento y por tanto en un total de bk 
observaciones). Debido a que los rangos de 1 a k estan asignados dentro de cada bloque, la suma 
de los rangos asignados en cada bloque esl + 2 + ••• + k = k(k + l)/2. Asf, la suma de todos 
los rangos asignados en el analisis es bk(k + l)/2. Si R denota el promedio general de los 
rangos de todas las observaciones bk, se deduce que R = (k + \)/2. Considere el equivalente 
en rangos de la SST para un diseno de bloques aleatorizado dado por 

k 

W = b J2 ( R‘ ”^ )2 - 

i=i 

Si la hipotesis nula es verdadera y las distribuciones de probabilidad de las respuestas del 
tratamiento no difieren en localization, esperamos que los valores R, sean aproximadamente 
iguales y el valor resultante para W sea pequeno. Si la hipotesis alternativa fuera verdadera, 


Suponiendo que no haya empates, obtenga la distribution nula exacta del estadfstico H de Kruskal- 
Wallis para el caso k = 3, n i = n 2 = « 3 = 2. [Debido a que los tamanos muestrales son todos iguales, 
si los rangos 1 y 2 se asignan al tratamiento 1, los rangos 3 y 4 se asignan al tratamiento 2 y los rangos 
5 y 6 se asignan al tratamiento 3, el valor de H es exactamente el mismo que si los rangos 3 y 4 se asig- 
naran al tratamiento 1, los rangos 5 y 6 se asignaran al tratamiento 2 y los rangos 1 y 2 se asignaran al 
tratamiento 3. Esto es, para cualquier conjunto particular de rangos, podemos intercambiar los papeles 
de las k poblaciones y obtener los mismos valores del estadfstico H. Entonces, el numero de casos que 
debemos considerar puede ser reducido por un factor de \/k\. En consecuencia, H debe ser evaluado 
solo para (6!/[2! ■ 2! ■ 2!])/3! = 15 arreglos distintos de rangos.] 

La prueba de Friedman para disenos de 
bloques aleatorizados 
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esperariamos que esto llevara a diferencias entre los valores R, y grandes valores de W co- 
rrespondientes. En lugar de W, Friedman considero el estadfstico F r = 12 W/[k(k + 1)], que 
se puede reescribir (vease el Ejercicio 15.44) como 


Fr 


12 


bk(k + l)f=J 




- 3b(k + 1). 


Como vimos antes, la hipotesis nula de localizaciones iguales es rechazada a favor de la al- 
ternativa de que las distribuciones de tratamiento difieren en localization si el valor de F r es 
grande. Esto es, la prueba de nivel a correspondiente rechaza la hipotesis nula a favor de la 
alternativa si F r > f r {a), donde/ r (a) es tal que, cuando H 0 es verdadera, P[F r > f r (a)\ = a. 

Si no hay empates entre las observaciones dentro de los bloques, la distribucion nula de 
F r puede (tediosamente) hallarse con el uso de los metodos del Capftulo 2. Para cualesquiera 
valores de b y k, la distribucion de F r se halla como sigue. Si la hipotesis nula es verdadera, 
entonces cada una de las k\ permutaciones de los rangos 1,2 k dentro de cadabloque es 
igualmente probable. Ademas, como suponemos que las observaciones en bloques diferentes 
son mutuamente independientes, se deduce que cada una de las (kl) b posibles combinaciones 
de los b conjuntos de permutaciones para los rangos dentro del bloque son igualmente pro¬ 
bables cuando H 0 es verdadera. En consecuencia, podemos evaluar el valor de F r para cada 
caso posible y por tanto dar la distribucion nula de F r (vease el Ejercicio 15.45). Los valores 
seleccionados dcf r (a) para varias opciones de k y I? se muestran en la Tabla A.22 de Hollander 
y Wolfe (1999). A1 igual que los otros procedimientos no parametricos estudiados en este ca¬ 
pftulo, la ventaja real de este procedimiento es que se puede usar cualquiera que sea la forma 
de las distribuciones reales de las poblaciones correspondientes a los tratamientos. 

Como fue el caso con el estadfstico de Kruskal-Wallis, la distribucion nula del estadfstico 
F r de Friedman se puede calcular con una distribucion % 2 con k — I grados de libertad mien- 
tras b sea “grande.” La evidencia empfrica indica que la aproximacion es adecuada si b (el 
numero de bloques) o k (el numero de tratamientos) es mayor que 5. De nuevo, nuestros ejem- 
plos y ejercicios resuelven situaciones en las que esta aproximacion con muestras grandes es 
adecuada. Si usted necesita poner en practica un analisis de Friedman para muestras pequenas, 
consulte la obra de Hollander y Wolfe (1999) para obtener valores crfticos apropiados. 


Prueba de Friedman basada en F r para un diseno de bloques aleatorizado 

Hipotesis nula: H 0 : las distribuciones de probabilidad para los k tratamientos son 
identicas. 

Hipotesis alternativa: Fl a : al menos dos de las distribuciones difieren en localiza¬ 
cion. 

k 

Estadfstico de prueba: F r = {12 /[bk(k + 1)]}^^R ( 2 — 3 b(k + 1), donde 

i=l 

b = numero de bloques, 
k = numero de tratamientos, 

R i = suma de los rangos para el /-esimo tratamiento, donde el rango de cada medi- 
cion se calcula con respecto a su tamano dentro de su propio bloque. 

Region de rechazo: F, > xk con (£ — 1) grados de libertad. 

Suposiciones: los tratamientos se asignan al azar a unidades experimentales dentro 
de los bloques. Ya sea que el numero de bloques ( b ) o el numero de tratamientos 
(, k ) excedan de 5. 
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EJEMPLO 15.8 Un experimenter para comparar los tiempos de terminacion para tres trabajos tecnicos se rea- 
lizo de la siguiente manera. Debido a que los tiempos de terminacion pueden variar en forma 
considerable de una persona a otra, a cada uno de los seis tecnicos se le pidio ejecutar los 
tres trabajos, mismos que fueron presentados a cada tecnico en orden aleatorio con retraso 
apropiado entre los trabajos. ^Los datos de la Tabla 15.7 presentan suficiente evidencia para 
indicar que las distribuciones de tiempos de terminacion para los tres trabajos difieren en lo¬ 
calization? Use a = .05. Establezca llmites para el valor p asociado. 


Tabla 15.7 Tiempos de terminacion para tres trabajos 


Tecnico 

Trabajo A 

Rango 

Trabajo B 

Rango 

Trabajo C 

Rango 

1 

1.21 

1 

1.56 

3 

1.48 

2 

2 

1.63 

1.5 

2.01 

3 

1.63 

1.5 

3 

1.42 

1 

1.70 

2 

2.06 

3 

4 

1.16 

1 

1.27 

2.5 

1.27 

2.5 

5 

2.43 

2 

2.64 

3 

1.98 

1 

6 

1.94 

1 

2.81 

3 

2.44 

2 



R t =7.5 

R 2 = 16.5 


R 3 = 12 


Solution El experimento fue ejecutado de acuerdo con un diseno de bloques aleatorizado con tecnicos 
desempenando el papel de bloques. En este caso, k = 3 tratamientos se compararon usando 
b = 6 bloques. Como el numero de bloques excede de 5, podemos usar el analisis de Friedman 
y comparar el valor de F r contra Xa > con base en k — 1 = 2 grados de libertad. Si se consulta la 
Tabla 6, Apendice 3, encontramos = 5.99147. Para los datos dados en la Tabla 15.7, 


Fr = 6(^4 j [(7 ' 5)2 + (16 ' 5)2 + ° 2)2] “ 3(6)(4) = 6 ' 75 ' 


Como F r = 6.75, que excede de 5.99147, concluimos con un nivel de a = .05 que los tiempos 
de terminacion de al menos dos de los tres trabajos poseen distribuciones de probabilidad que 
difieren en localization. 

Como F r = 6.75 es el valor observado de un estadistico que tiene aproximadamente una 
distribution \ 2 con 2 grados de libertad, se deduce que (aproximadamente) .025 < valor 
p < .05. La aplicacion Chi-Square Probability and Quantiles aplica para establecer que el 
valor p aproximado = P(x 2 > 6.75) = .0342. ■ 


En algunas situaciones podrfa ser facil clasificar las respuestas dentro de cada bloque, pero 
mucho mas difitil asignar un valor numerico significativo a la respuesta para cada tratamiento 
en los bloques. Un ejemplo que ilustra esta situation aparece en el Ejercicio 15.42. 

Se puede ver (vease el Ejercicio 15.43) que, si deseamos comparar solo k = 2 tratamientos 
usando un diseno de bloques aleatorizado (para que los bloques sean de tamano 2), el estadis¬ 
tico de Friedman es el cuadrado del estadistico estandarizado de signo (esto es, el cuadrado 
del estadistico Z dado en la Section 15.3). Entonces, para k = 2, el analisis de Friedman es 
equivalente a una prueba de signo de dos colas. 
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Ejercicios 

15.37 En un estudio del sabor de antibioticos para ninos, Doreen Matsui y sus colegas emplearon una muestra 
voluntaria de ninos sanos para evaluar sus reacciones al sabor de cuatro antibioticos. 5 Las respuestas de 
los ninos se midieron en una escala analogica visual de 10 centimetres que incorporaba el uso de caras, 
de triste (calificacion baja) a alegre (calificacion alta). Las calificaciones minima y maxima fueron, 
respectivamente, 0 y 10. Los datos de la siguiente tabla (simulados a partir de los resultados dados en el 
informe de Matsui) se obtuvieron cuando a cada uno de cinco ninos se les pregunto la calificacion del 
gusto de los cuatro antibioticos. 


Nino 


Antibiotico 


I 

II 

III 

IV 

1 

4.8 

2.2 

6.8 

6.2 

2 

8.1 

9.2 

6.6 

9.6 

3 

5.0 

2.6 

3.6 

6.5 

4 

7.9 

9.4 

5.3 

8.5 

5 

3.9 

7.4 

2.1 

2.0 


a ),Hay suficiente evidencia para concluir que hay diferencias en el sabor percibido de los diferentes 
antibioticos? Establezca un llmite o encuentre el valor p aproximado. 

b ^Que se concluirla en el nivel de significancia a = .05? 

c /.Por que Matsui hizo que cada nino ordenara los cuatro antibioticos en lugar de usar 20 ninos di¬ 
ferentes, seleccionando aleatoriamente 5 para que recibieran solo el antibiotico I, otros 5 para que 
recibieran solo el antibiotico II, 5 de los restantes para que recibieran solo el antibiotico III, con los 
5 restantes recibiendo solo el antibiotico IV? 

15.38 Se efectuo un experimento para evaluar si se acumulan metales pesados en plantas que crecen en suelos 
mejorados con lodos y si hay una acumulacion asociada de esos metales en pulgones que se alimentan 
de esas plantas. 6 Los datos de la siguiente tabla son concentraciones de cadmio (en microgramos/kilo- 
gramo) en plantas que crecen con seis diferentes magnitudes de aplicacion de lodos para tres diferentes 
cosechas. Las magnitudes de aplicacion son los tratamientos y las tres cosechas representan bloques de 
tiempo. 


Rapidez 


Cosecha 


1 

2 

3 

Control 

162.1 

153.7 

200.4 

1 

199.8 

199.6 

278.2 

2 

220.0 

210.7 

294.8 

3 

194.4 

179.0 

341.1 

4 

204.3 

203.7 

330.2 

5 

218.9 

236.1 

344.2 


5. Fuente: D. Matsui y otros, “Assessment of the Palatability of /3-Lactamase-Resistant Antibiotics in Children,” 
Archives of Pediatric Adolescent Medicine 151(1997): 559-601. 

6. Fuente : G. Merrington, L. Winder, and I. Green, "The Uptake of Cadmium and Zinc by the Birdcherry Oat Aphid 
Rhopalosiphum Padi (Homoptera: Aphididae) Feeding on Wheat Grown on Sewage Sludge Amended Agricultural 
Soil,” Environmental Pollution 96(1) (1997): 111-114. 
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a ^Hay suficiente evidencia para indicar una diferencia en la acumulacion de cadmio en plantas que 
crecen en lotes sometidos a diferentes niveles de aplicacion de lodos? Establezca un limite o deter¬ 
mine el valor p aproximado. 

b ^,Que se concluiria en el nivel de significancia a = .01? 

15.39 La corrosion de metales es un problema en numerosos aparatos mecanicos. Tres selladores que se usan 
para ayudar a retardar la corrosion de metales se probaron para ver si hubo algunas diferencias entre 
ellos. Muestras de diez lingotes diferentes de la misma composition de metal se trataron con cada uno 
de los tres selladores y la cantidad de corrosion se midio despues de exponerlos a las mismas condicio- 
nes ambientales durante un mes. Los datos se muestran en la siguiente tabla. ,-Hay alguna evidencia de 
una diferencia en la capacidad de los selladores para evitar la corrosion? Pruebe usando a = .05. 


Lingote 


Sellador 


I 

11 

ill 

1 

4.6 

4.2 

4.9 

2 

7.2 

6.4 

7.0 

3 

3.4 

3.5 

3.4 

4 

6.2 

5.3 

5.9 

5 

8.4 

6.8 

7.8 

6 

5.6 

4.8 

5.7 

7 

3.7 

3.7 

4.1 

8 

6.1 

6.2 

6.4 

9 

4.9 

4.1 

4.2 

10 

5.2 

5.0 

5.1 


15.40 Un grave problema relacionado con las sequias para los agricultores es la diseminacion de la aflatoxina, 
sustancia altamente toxica generada por hongos y que contamina el maiz en los campos. En niveles mas 
altos de contamination, la aflatoxina es riesgosa para los animales y posiblemente para la salud humana. 
(Oficiales de la FDA han establecido un limite maximo de 20 partes por mil millones de aflatoxina como 
seguro para ventas interestatales.) Tres sustancias que se aplican con aspersor, A, B y C, se han inventa- 
do para controlar la aflatoxina en los campos de maiz. Para determinar si existen diferencias entre estas 
sustancias, diez mazorcas de maiz se escogen al azar de un campo de maiz contaminado y cada una se 
corta en tres partes de igual tamano. Las sustancias se asignan aleatoriamente a las partes de cada ma- 
zorca de maiz, formando asi un diseno de bloques aleatorizado. La siguiente tabla muestra la cantidad 
(en partes por mil millones) de aflatoxina presente en las muestras de maiz despues de rociarlas. Use la 
prueba de Friedman basada en F r para determinar si hay diferencias entre las sustancias para el control 
de la aflatoxina. Establezca limites aproximados para el valor p. 


Mazorca 


Sustancia 


Mazorca 


Sustancia 


A 

B 

C 

A 

B 

C 

1 

21 

23 

15 

6 

5 

12 

6 

2 

29 

30 

21 

7 

18 

18 

12 

3 

16 

19 

18 

8 

26 

32 

21 

4 

20 

19 

18 

9 

17 

20 

9 

5 

13 

10 

14 

10 

4 

10 

2 


15.41 Se realizo un estudio para comparer las preferencias de ocho “expertos en escuchar” respecto a 15 
modelos (con precios de lista aproximadamente iguales) de un componente particular de un sistema 
estereo. Se hizo todo esfuerzo posible por asegurar que las diferencias percibidas por los escuchas se 
debieran al componente de interes y no a otra causa (todos los otros componentes del sistema eran iden- 
ticos, se uso el mismo tipo de rnusica, la musica se reprodujo en el mismo cuarto, etc.). Entonces, los 
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resultados de la prueba de escucha reflejan las preferencias de audio de los jueces y no juicios respecto 
a la calidad, confiabilidad u otras variables. Ademas, los resultados estan relacionados solo con los mo- 
delos de los componentes usados en el estudio y no a ningun otro modelo que pueda ser ofrecido por los 
diversos fabricantes. Los datos de la siguiente tabla muestran los resultados de las pruebas de escucha. 
Los modelos se describen simplemente como A, B,..., O. Bajo cada encabezado de columna estan los 
numeros de los jueces que clasificaron cada una de las marcas de componente de 1 (rango mas bajo) a 
15 (rango mas alto). 


Modelo 








Rango 







1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

A 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

8 

B 

0 

0 

0 

1 

0 

2 

1 

1 

1 

0 

0 

0 

0 

2 

0 

C 

0 

1 

1 

1 

4 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 

D 

1 

0 

1 

1 

0 

1 

0 

0 

1 

0 

1 

0 

1 

1 

0 

E 

0 

2 

1 

3 

0 

2 

0 

0 

0 

0 

0 

0 

0 

0 

0 

F 

0 

0 

0 

0 

0 

0 

0 

0 

1 

2 

2 

3 

0 

0 

0 

G 

0 

0 

0 

0 

0 

0 

0 

0 

0 

1 

0 

2 

4 

1 

0 

H 

1 

2 

1 

1 

0 

0 

2 

1 

0 

0 

0 

0 

0 

0 

0 

I 

3 

2 

1 

0 

0 

0 

0 

0 

0 

1 

0 

1 

0 

0 

0 

J 

0 

0 

1 

0 

2 

0 

2 

0 

0 

0 

2 

0 

1 

0 

0 

K 

0 

0 

0 

0 

0 

0 

1 

1 

0 

2 

1 

1 

1 

1 

0 

L 

0 

0 

0 

0 

0 

0 

1 

1 

4 

0 

1 

0 

1 

0 

0 

M 

1 

1 

2 

1 

1 

2 

0 

0 

0 

0 

0 

0 

0 

0 

0 

N 

2 

0 

0 

0 

0 

0 

1 

1 

0 

0 

0 

1 

0 

3 

0 

O 

0 

0 

0 

0 

1 

1 

0 

2 

1 

2 

1 

0 

0 

0 

0 


a Use el procedimiento de Friedman para probar si las distribuciones de las calificaciones de preferen- 
cia difieren en localization para los 15 modelos del componente. Establezca limites para el nivel de 
significancia alcanzado. (,Que se concluirfa en el nivel de significancia de a — .01? [Sugerencia: la 
suma de los rangos asociada con el componente del modelo Oes5 + 6 + 8 + 8 + 9+ 10 + 10 + 
11 =67; otras sumas de rango se pueden calcular de una manera analoga.] 

b Si, antes de ejecutar el experimento deseamos comparer los componentes de los modelos GyH, esta 
comparacion podrfa hacerse usando la prueba de signos presentada en la Section 15.3. Usando la 
information recien dada, podemos determinar que el modelo G fue preferido al modelo H por los 
ocho jueces. Explique por que. Proporcione el nivel de significancia alcanzado si la prueba de signos 
se uso para comparer componentes de los modelos GyH. 

c Explique por que no hay suficiente information para usar la prueba de signos en una comparacion 
solo de los modelos H y M. 

15.42 Se realiza un experimento para investigar el efecto toxico de tres sustancias quimicas. A, B y C, en la piel 
de ratas. Tres cuadros adyacentes de f pulgada se marcan en los lomos de ocho ratas y cada una de las tres 
sustancias se aplica a cada rata. Los cuadros de piel de cada rata se clasifican de acuerdo con la severidad 
de la irritation (1 = menos severe, 3 = severidad maxima). Los datos resultantes se dan en la siguiente 
tabla. ^Hay suficiente evidencia para apoyar la hipotesis de investigation de que las distribuciones de 
probabilidad de las calificaciones de irritation de la piel, correspondientes a las tres sustancias quimicas, 
difieren en localization? Use a = .01. ( Nota : clasificar la severidad de las reacciones a las sustancias 
quimicas para cada rata es probablemente mucho mas significativo que asignar una “calificacion de 
irritation” a cada parte de piel.) 
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Rata 

Sustancia qufmica 

A 

B 

C 

1 

3 

2 

1 

2 

3 

2 

1 

3 

2 

3 

1 

4 

1 

3 

2 

5 

1 

2 

3 

6 

1 

3 

2 

7 

2 

3 

1 

8 

2 

1 

3 


15.43 Considere el estadfstico F r de Friedman, cuando k = 2 y b = (numero de bloques) = n. Entonces, 
F r = (2/n) (R 2 + R|) — 9n. Sea M el numero de bloques (pares) en los que el tratamiento uno tiene la 
clasificacion 1. Si no hay empates, entonces el tratamiento 1 tiene clasificacion 2 en los restantes n — M 
pares. Asi, R l = M + 2(n — M) = 2 n — M. De manera analoga, R, = n + M. Sustituya estos valores en 
la expresion anterior para F r y demuestre que el valor resultante es 4 (M — ,5n) 2 /n. Compare este resultado 
con el cuadrado del estadfstico Z de la Seccion 15.3. Este procedimiento demuestra que F r = Z 2 . 


15.44 


Considere el estadfstico de Friedman 


Fr = 


12 b 


k(k + 1) 


- *) 2 


Eleve al cuadrado cada termino de la suma y demuestre que una forma altemativa de F r es 

12 k 

F r = Y' Rj - 3 b(k + 1). 

bk{k + 1)£- ' 


[Sugerencia: recuerde que R t — Rj / b, R = (k + l)/2 y observe que = suma de todos los ran- 
gos = bk(k + l)/2]. 


15.45 Si no hay empates y b = 2, k = 3, deduzca la distribucion nula exacta de F r . 


15.9 Prueba de corridas de ensayo: una prueba 
de aleatoriedad 

Considere un proceso de produccion en el que piezas manufacturadas salen en secuencia y cada 
una es clasificada como defectuosa (D) o no defectuosa ( N ). Hemos estudiado como podrfamos 
comparar la fraccion de piezas defectuosas para dos intervalos iguales de tiempo, con el uso 
de una prueba Z (Capitulo 10) y ampliado esta prueba para probar la hipotesis de p constante 
pasa dos o mas intervalos de tiempo usando la prueba \ 2 del Capitulo 14. Los propositos de 
estas pruebas eran detectar un cambio o tendencia en la fraccion de piezas defectuosas, p. La 
evidencia para indicar una fraccion creciente de piezas defectuosas podrfa indicar la necesidad 
de un estudio del proceso para localizar la fuente del problema. Un valor decreciente podrfa 
sugerir que un programa de control de calidad del proceso estaba teniendo un efecto benefico 
para reducir la fraccion de piezas defectuosas. 

Las tendencias en la fraccion de piezas defectuosas (u otras medidas de calidad) no son la 
unica indicacion de falta de control de un proceso. Un proceso podrfa estar causando corridas 
periodicas de piezas defectuosas aunque la fraccion promedio de piezas defectuosas permanezca 
constante, para todos los fines practicos, en periodos largos. Por ejemplo, los focos de proyecto- 
res son fabricados en una maquina giratoria con un numero fijo de posiciones para focos. Uno de 
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DEFINICION 15.1 


FIGURA 15.3 
Region de rechazo 
para la prueba de 
corridas de ensayo 


estos se coloca en la maquina en una position determinada, se extrae el aire, se bombean gases en 
el interior del foco y la base de vidrio se sella con fuego. Si una maquina contiene 20 posiciones y 
varias posiciones adyacentes son defectuosas (quiza debido a demasiado calor empleado en el pro- 
ceso de sellado), oleadas de focos defectuosos saldran del proceso en forma periodica. Las pruebas 
que comparan la fraction del proceso de piezas defectuosas producidas durante intervalos iguales 
de tiempo no detectaran esta dificultad periodica del proceso. Esta periodicidad, indicada por las 
corridas de piezas defectuosas, indica que no hay aleatoriedad en la aparicion de piezas defectuosas 
a lo largo del tiempo y puede ser detectada por una prueba de aleatoriedad. La pmeba estadfstica 
que presentamos, conocida como prueba de corridas de ensayo, es estudiada en detalle por Wald y 
Wolfowitz (1940). Seguiran otras aplicaciones practicas de la pmeba de corridas de ensayo. 

Como su nombre lo indica, las pruebas de corridas de ensayo se usan para estudiar una 
secuencia de eventos en la que cada elemento de la secuencia puede tomar uno de dos resul- 
tados, no defectuoso ( S ) o defectuoso (F). Si consideramos la sucesion de piezas que salen 
de un proceso de manufactura como defectuosas (F) o no defectuosas (.S'), la observation de 
veinte piezas podrfa dar 

SSSSSFFSSS 

FFFSSSSSSS. 

Observamos las agrupaciones de piezas defectuosas y no defectuosas y nos preguntamos si 
esta agrupacion implica no aleatoriedad y, en consecuencia, falta de control de proceso. 


Una corrida de ensayo es una subsecuencia maxima de elementos semejantes. 

Por ejemplo, los primeros cinco exitos constituyen una subsecuencia maxima de 5 elementos 
semejantes (esto es, incluye el numero maximo de elementos semejantes antes de encontrar 
un F). (Los primeros 4 elementos forman una subsecuencia de elementos semejantes, pero no 
es maxima porque el quinto elemento tambien podrfa estar incluido.) En consecuencia, los 20 
elementos estan dispuestos en cinco corridas de ensayo, el primero conteniendo cinco S, el 
segundo conteniendo dos F, y asf sucesivamente. 

Un numero muy grande o muy pequeno de corridas de ensayo en una secuencia indica no 
aleatoriedad. Por tanto, sea R (el numero de corridas de ensayo en una secuencia) el estadfs- 
tico de prueba y sean R < k. x v R > k 2 la region de rechazo, como se indica en la Figura 15.3. 
Entonces debemos hallar la distribution de probabilidad para R, P(R = r), para calcular a y 
localizar una region de rechazo aceptable para la prueba. 

Suponga que la secuencia completa contiene n ] elementos S y n 2 elementos F, resultando en K, 
corridas de ensayo de las S y Y 2 corridas de ensayo de las F, donde (Ej + Y 2 ) = R. Entonces, para 
una Ej determinada, K, puede ser igual a Ej, (Ej — 1) o (Ej + 1). Con m denote el numero maximo 
posible de corridas de ensayo. Observe que m = 2n ] si n t = n 2 y que m = (2 n 1 + 1) si n, < n 2 . 
Supondremos que todo arreglo distinguible de los (n t + n 2 ) elementos de la secuencia constituye 
un evento simple para el experimento y que los puntos muestrales son igualmente probables. Nos 
resta a continuation contar el numero de puntos muestrales que implican R corridas. 

El numero total de arreglos distinguibles de n x elementos S y n 2 elementos F es 

fni +n 2 \ 

V «i /’ 


2 

3 

4 

. c 


m 



Rechazar 

Numero de corridas de ensayo R 

Rechazar 
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FIGURA 15.4 
Distribucion de n, 
elementos 5 en y, 
celdas (ninguna 
vacfa) 


EJEMPLO 15.9 


\s\ssss\ss... |ss|sss[s| 


y por tanto la probabilidad por punto muestral es 

1 

n i + «2 

«i 

El numero de formas de lograr y x corridas de ensayo S es igual al numero de arreglos identifi- 
cables de n 1 elementos indistinguibles en y, celdas, ninguna de las cuales esta vacfa, como se 
representa en la Figura 15.4. Esto es igual al numero de formas de distribuir (y, — 1) barras 
interiores en los (n [ — 1) espacios entre los S elementos (las dos barras exteriores permanecen 
fijas). En consecuencia, es igual al numero de formas de seleccionar (y, — 1) espacios (para 
las barras) fuera de los (n ] — 1) espacios disponibles, o sea 

/«l - 1 

V>’ i -1 

El numero de formas de observar y x corridas de ensayo S y y 2 corridas de ensayo F, obte- 
nido al aplicar la regia mn, es 


fn\ - 1 

\yi -1 



Esto da el numero de puntos muestrales en el evento “y l corridas de ensayo de las S v y 2 
corridas de ensayo de las F”. Entonces, al multiplicar este numero por la probabilidad por 
punto muestral, obtenemos la probabilidad de exactamente y, corridas de ensayo de las S v y 2 
corridas de ensayo de las F: 


p(y\, yi) 



Entonces, P(R = r) es igual a la suma de p(y v y 2 ) en todos los valores de y, y yy tales que (y, 

+ y 2 ) = r - 

Para ilustrar el uso de la formula, el evento R = 4 podrfa ocurrir cuando y, = 2 y y 2 = 2 
con elementos S o F comenzando las secuencias. Por tanto, 


P(R =4) = 2P(Yi = 2, Y 2 = 2). 


Por otra parte, R = 5 podrfa ocurrir cuando yq = 2 y y 2 = 3 o cuando y l = 3 y y 2 = 2, y estos 
sucesos son mutuamente excluyentes. Entonces, 

P(R =5) = P(Y\ =3,Y 2 =2) + P(Y x =2 ,Y 2 = 3). 


Suponga que una secuencia esta formada por n l = 5 elementos S y n-, = 3 elementos F. Calcule 
la probabilidad de observar R = 3 corridas de ensayo. Del mismo modo, calcule P(R < 3). 
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Solucion Tres corridas de ensayo podrfan ocurrir cuando = 2 y y 2 = 1, o cuando y, = 1 y y 2 = 2. 
Entonces 

P(R = 3) = P(Y 1 = 2, Y 2 = 1) + P(Yi = 1, Y 2 = 2) 



A continuacion requerimos que P(R < 3) = P(R =2) + P(R =3). De conformidad con 
esto, 


P(R =2) =2 P(Yi = 1 ,Y 2 = 1) = (2) 


X 


= — = .036. 
56 


Asi, la probabilidad de 3 o menos corridas de ensayo es.107 + .036 = .143. ■ 


Los valores de P(R < a) se dan en la Tabla 10, Apendice 3, para todas las combinaciones 
de n j y n 2 , donde n ] y n 2 son menores o iguales a 10. Estas se pueden usar para localizar las 
regiones de rechazo de pruebas de una o de dos colas. Ilustramos con un ejemplo. 


EJEMPLO 15.10 Un examen de verdadero-falso se construyo con las preguntas que corren en la siguiente se- 
cuencia: 

TFFTFTFTTFTFFTFTFTTF. 

(T = verdadero; F = falso) 

^Esta secuencia indica una desviacion de la aleatoriedad en el arreglo de respuestas T y FI 

Solucion La secuencia contiene n, = 10 respuestas T y n 2 — 10 respuestas F, con y = 16 corridas de 
ensayo. La no aleatoriedad puede estar indicada ya sea por un numero inusualmente peque- 
no o grande de corridas de ensayo; en consecuencia, estaremos usando una prueba de dos 
colas. 

Suponga que deseamos usar a aproximadamente igual a .05 con .025 o menos en cada 
cola de la region de rechazo. Entonces, de la Tabla 10, Apendice 3, con n ] = n 2 = 10, vemos 
que P(R < 6) = .019 y P(R < 15) = .981. Entonces, P(R > 16) = 1 - P(R < 15) = .019 
y rechazariamos la hipotesis de aleatoriedad en el nivel de significancia de a = .038 si R < 
6 o R > 16. Como R = 16 para los datos observados, concluimos que existe evidencia para 
indicar no aleatoriedad en el arreglo de las respuestas del profesor. El intento de mezclar las 
respuestas esta exagerado. ■ 


Una segunda aplicacion de la prueba de corridas de ensayo esta en detectar no aleatorie¬ 
dad de una secuencia de medidas cuantitativas en el tiempo. Estas secuencias, conocidas 
como series de tiempo, se presentan en numerosos campos. Por ejemplo, la medicion de una 
caracterfstica de calidad de un producto industrial, presion sanguinea de una persona y el 
precio de una accion en el mercado accionario varfan todos en el tiempo. Las desviaciones 
de la aleatoriedad en una serie, causadas ya sea por tendencias o periodicidades, se pueden 
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detectar al examinar las desviaciones de las mediciones de la serie de tiempo de su promedio. 
Las desviaciones negativas y positivas podrfan estar denotadas por S y F, respectivamente, y 
podriamos entonces probar esta secuencia de tiempo de desviaciones para no aleatoriedad. 
Ilustramos con un ejemplo. 


EJEMPLO 15.11 Se produce papel en un proceso continuo. Suponga que una medicion de la brillantez Y se 
hace en el papel una vez por hora y que los resultados aparecen como se muestra en la Figura 
15.5. 

El promedio y para las 15 mediciones muestrales aparece en la figura. Observe las desvia¬ 
ciones arriba de y. ( : ,Estos datos indican falta de aleatoriedad y por tanto sugieren periodicidad 
y falta de control en el proceso? 


FIGURA 15.5 Brillantez 

Brillantez del papel y 

contra tiempo 








y 









X 

Tiempo (horas) 


Solucion La secuencia de desviaciones negativas (S) y positivas OF), como se indica en la Figura 15.5, 
es 

SSSSFFSFFSFSSSS. 

Entonces, n l = 10, n 2 = 5 y R = 7. Consultando laTabla 10 del Apendice 3, encontramos P(R 
< 7) = .455. Este valor de R no es improbable, suponiendo que la hipotesis de aleatoriedad 
sea verdadera. En consecuencia, no hay suficiente evidencia para indicar no aleatoriedad en la 
secuencia de mediciones de brillantez. ■ 


La prueba de corridas de ensayo tambien se puede usar para comparar dos distribuciones 
de frecuencia poblacional para un experimento de dos muestras no pareado. De esta forma, 
tenemos una alternativa para la prueba U de Mann-Whitney (Section 15.6). Si las mediciones 
para las dos muestras se arreglan en orden de magnitud, forman una secuencia. Las medicio¬ 
nes para las muestras 1 y 2 se pueden denotar como S y F, respectivamente y una vez mas 
nos ocupamos de una prueba de aleatoriedad. Si todas las mediciones para la muestra 1 son 
mas pequenas que las de la muestra 2, la secuencia resultara en SSSS... SFFF ... F o R 
= 2 corridas de ensayo. Un valor pequeno de R proporciona evidencia de una diferencia en 
las distribuciones poblacionales de frecuencia y la region de rechazo escogida es R < a. Esta 
region de rechazo implica una prueba estadfstica de una cola. Un ejemplo de la aplicacion de 
la prueba de corridas de ensayo para comparar dos distribuciones poblacionales de frecuencia 
se deja como ejercicio. 
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A1 igual que en el caso de los otros estadfsticos de prueba no parametricos estudiados en 
secciones anteriores de este capftulo, la distribucion de probabilidad para R tiende hacia la 
normalidad cuando n 1 y n 2 se hacen grandes. La aproximacion es buena cuando « y n 2 sean 
ambos mayores que 10. Por esta razon, podemos usar el estadistico Z como estadfstico de 
prueba con muestras grandes, donde 


y 


R - E(R) 

wm ’ 


E(R) 

V(R) 


2n i /2 2 
n\ + n 2 


+ 1 , 


2n i n 2 (2n i n 2 ~n\ - n 2 ) 
(«i +n 2 ) 2 (n , +n 2 - 1) 


son el valor esperado y la varianza de R , respectivamente. La region de rechazo para una prue¬ 
ba de dos colas, con a = .05, es | z | >1.96. Si a es la probabilidad deseada de un error tipo I, 
para una prueba de cola superior, rechazamos la hipotesis nula si z > z a (para una prueba de 
cola inferior, rechazamos H 0 si z < ~Z a )- 

Ejercicios 

1 5.46 Considere una prueba de corridas de ensayo basado en n l = n 2 — 5 elementos. Suponiendo que H 0 sea 
verdadera, use la Tabla 10, Apendice 3, para hallar lo siguiente: 

a P(R = 2). 
b P(R < 3). 
c P(R< 4). 

15.47 El supervisor de un sindicato dice que quienes solicitan empleos son seleccionados sin considerar de que 
raza son. Los registros de contratacion del local, que contiene solo miembros masculinos, mostraron la 
siguiente secuencia de contratacion de blancos (W) y negros (5): 

WWWWBWWWBBWBB 

^Estos datos sugieren una seleccion racial no aleatoria en la contratacion de miembros del sindicato? 

15.48 Las condiciones ( D por enfermo, S por sano) de los arboles individuals de una fila de diez alamos se 
encontro que estaban, de izquierda a derecha: 

SSDDSDDDSS 

^Elay suficiente evidencia para indicar no aleatoriedad en la secuencia y por tanto la posibilidad de con- 
tagio? 

15.49 Las piezas que salen de un proceso continuo de produccion se clasificaron como defectuosas (D) o no 
defectuosas ( N). Una secuencia de piezas observada en el tiempo fue como sigue: 

DNNNNNNDDNNNNNND D 
DNNNNNDNNNDDNNNDD. 

a Calcule la probabilidad de que R £ 11, donde n 1 = 11 y n 2 = 23. 

b ^Estos datos sugieren falta de aleatoriedad en la presencia de piezas defectuosas y no defectuosas? 
Use la aproximacion de muestra grande para la prueba de corridas de ensayo. 
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15.50 Una grafica de control de calidad se ha mantenido para una caracterfstica medible de piezas tomadas de 
una banda transportadora en un punto fijo de una lfnea de produccion. Las mediciones obtenidas hoy, en 
orden de tiempo. son como sigue: 

68.2 71.6 69.3 71.6 70.4 65.0 63.6 64.7 

65.3 64.2 67.6 68.6 66.8 68.9 66.8 70.1 

a Clasifique las mediciones de esta serie de tiempo como arriba o abajo de la media muestral y de¬ 
termine (usando la prueba de corridas de ensayo) si observaciones consecutivas sugieren falta de 
estabilidad en el proceso de produccion. 

b Divida el periodo en dos partes iguales y compare las medias usando la prueba t de Student. ^Los 
datos dan evidencia de un cambio en el nivel medio de las caracterfsticas de calidad? Explique. 

15.51 Consulte el Ejercicio 15.24. Use la prueba de corridas de ensayo para analizar los datos. Compare su 
respuesta a este ejercicio con su respuesta al Ejercicio 15.24. 

15.52 Consulte el Ejercicio 15.25. Si en verdad las baterfas experimentales tienen una vida media mas larga, 
^cual serfa el efecto de esto en el numero esperado de corridas de ensayo? Usando la teoria de muestras 
grandes para la prueba de corridas de ensayo, pruebe (usando a = .05) si hay una diferencia en las dis- 
tribuciones de la duration de baterfas para las dos poblaciones. Proporcione el valor p aproximado. 


15.10 Coeficiente de correlacion de rangos 

En las secciones anteriores usamos rangos para indicar la magnitud relativa de observaciones en 
pruebas no parametricas para comparacion de tratamientos. Ahora empleamos la misma tec- 
nica para probar una correlacion entre dos variables clasificadas. Dos coeficientes de correla¬ 
tion de rango comun son el estadfstico r s de Spearman y el t de Kendall. Presentamos el r s 
de Spearman porque su calculo es analogo al del coeficiente r de correlacion muestral de la 
Section 11.8. El coeficiente de correlacion de rango de Kendall se estudia con detalle en la 
obra de Kendall y Stuart (1979). 

Suponga que ocho profesores de ciencias elementales han sido clasificados por un juez 
segun su capacidad de ensenanza y todos han hecho un examen national de profesores. Los 
datos se presentan en la Tabla 15.8. <',Los datos sugieren concordancia entre la clasificacion 
del juez y la calificacion del examen? Alternativamente podrfamos expresar esta pregunta al 
consultar si existe correlacion entre la clasificacion del juez y los rangos de calificaciones del 
examen. 

Las dos variables de interes son la clasificacion y la calificacion del examen. La primera ya 
esta en forma de rango y las calificaciones del examen se pueden clasificar de modo analogo, 
como se muestra entre parentesis en la Tabla 15.8. Las clasificaciones para observaciones em- 


Tabla 15.8 Datos para profesores de ciencias 


Profesor 

Clasificacion 
del juez 

Calificacion 
del examen 

1 

7 

44(1) 

2 

4 

72 (5) 

3 

2 

69 (3) 

4 

6 

70(4) 

5 

1 

93 (8) 

6 

3 

82 (7) 

7 

8 

67 (2) 

8 

5 

80 (6) 
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EJEMPLO 15.12 

Solucion 


patadas se obtienen al promediar las clasificaciones que ocuparian las observaciones empatadas, 
como se hace para el estadi'stico U de Mann-Whitney. 

Recuerde que el coeficiente de correlacion muestral (Seccion 11.8) para observaciones (je,, 

>’i), (x 2 , y 2 )> • • • (*„> yJ esta dado P or 


_ 


i = 1 


E x ^ - - ( E x -) (X> 


<i= 1 


■\J S X X Syy 


\|L 


1 


E x E- 


i = 1 


<i =1 




Con R (,r ; ) denote el rango de x t entre x v x 2 ,, x n v con R(y ; ) denote el rango de y i entre y v 
y 2 ,... y n . El coeficiente de correlacion de rango de Spearman, r s , se calcula al sustituir los 
rangos como las mediciones pareadas en la formula anterior. Asf, 


V'R(x,)R(y,) - - 

U n 

n 

i= 1 

n 

E R( y> } 

i= 1 


\ 

X>(*;)] 2 - - 
U n 

n 

_i= 1 

2 

X>()7)] 2 - - 

U n L 

Em) 

i= 1 



Cuando no hay empates en las observaciones x ni en las observaciones y, esta expresion 
para r s se reduce algebraicamente a una expresion mas sencilla: 


rs = 1 “ 


6 Ed? 


i = \ 

n(n 2 — 1)’ 


donde d, = R(x,) - R(y;). 


Si el numero de empates es pequeno en comparacion con el numero de pares de datos, re- 
sultara un error pequeno por usar esta formula de atajo. Dejamos la prueba de esta simplifica- 
cion como ejercicio (Ejercicio 15.78) e ilustramos el uso de la formula mediante un ejemplo. 


Calcule r s para la clasificacion del juez y para los datos de calificacion del examen de la Tabla 
15.8. 

Las diferencias y cuadrados de las diferencias entre las dos clasificaciones se muestran en la 
Tabla 15.9. 

Sustituyendo en la formula para r s , obtenemos 


6 Yd? 

/=! 6(144) 

r s = 1 - — ’- = 1 - —-— = -.714. 

n(n 2 - 1) 8(64 - 1) 
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Tabla 15.9 Datos y calculos para el Ejemplo 15.12 


Profesor 

R(Xi) 

R(y,) 

d, 

df 

1 

7 

l 

6 

36 

2 

4 

5 

-1 

1 

3 

2 

3 

-1 

1 

4 

6 

4 

2 

4 

5 

1 

8 

-7 

49 

6 

3 

7 

-4 

16 

7 

8 

2 

6 

36 

8 

5 

6 

-1 

1 

Total 




144 


El coeficiente de correlacion de rango de Spearman se puede emplear como estadis- 
tico de prueba para probar la hipotesis de que no hay asociacion entre dos poblaciones. 
Suponemos que los n pares de observaciones (jq, y t ) se han seleccionado al azar y, por 
tanto, la ausencia de cualquier asociacion entre las poblaciones implica una asignacion 
aleatoria de los n rangos dentro de cada muestra. Cada asignacion aleatoria (para las dos 
muestras) representa un punto muestral asociado con el experimento y un valor de r s se 
puede calcular para cada uno. Es posible calcular la probabilidad de que r s tome un valor 
absoluto grande debido solo a la casualidad y, por tanto, sugiere una asociacion entre po¬ 
blaciones aun cuando exista ninguna. 

La region de rechazo para una prueba de dos colas incluye valores de r s cercanos a +1 y a 
-1. Si la alternativa es que la correlacion entre X y Y es negativa, rechazamos H 0 para valores 
de r s cercanos a -1. De manera similar, si la alternativa es que la correlacion entre X y Y es 
positiva, rechazamos H 0 para valores positivos grandes de r s . 

Los valores crfticos de r s se dan en la Tabla 11, Apendice 3. En el renglon superior de la 
tabla aparecen valores de a que se podrfan usar para una prueba de una cola de la hipotesis 
nula de no asociacion entre X y Y. El rnimero de pares de rango n aparece en el lado izquierdo 
de la tabla. Las entradas en la tabla muestran el valor crftico r 0 para una prueba de una cola. 
Entonces, P(r s > r 0 ) = a. Por ejemplo, supongamos que usted tiene n = 8 pares de rangos y 
la hipotesis de investigacion es que la correlacion entre los rangos es positiva. Entonces, usted 
desea rechazar la hipotesis nula de no asociacion solo para valores positivos grandes de r s y 
usara una prueba de una cola. Consultando la Tabla 11 y usando la fila correspondiente a n = 
8 y la columna para a = .05, se lee r 0 = .643. Por tanto, rechaza H 0 para todos los valores de 
r s mayores o iguales a .643. 

Si se desea dar el valor p asociado con un valor observado de r = .82, la Tabla 11 dice 
que H 0 seria rechazada con a = .025 pero no con a = .01. Asi, .01 < valor p < .025. 

Si usted pretende probar la hipotesis alternativa que afirma que los rangos estan corre- 
lacionados en forma negativa, la prueba se lleva a cabo exactamente de la misma manera. 
La unica diferencia es que se rechazara la hipotesis nula si r s < -.643. Es decir, solo se 
coloca un signo menos frente al valor tabulado de r 0 para obtener el valor crftico de la cola 
inferior. De manera similar, si r = -.82, entonces .01 < valor p < .025. 

Para realizar una prueba de dos colas, se rechaza la hipotesis nula si r s > r 0 o r s < —r 0 . El 
valor de a para la prueba es el doble del que se muestra en la parte superior de la tabla. Por 
ejemplo, si n = 8 y se elige la columna .025, se rechaza H 0 si r s > .738 or s < -.738. El valor 
a para la prueba es 2(.025) = 005. 

El valor p asociado con una prueba de dos colas basada en un valor observado de r = .82 es 
el doble (debido a las dos colas) del valor p de una cola; esto es, .02 < valor p < .05. 
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EJEMPLO 15.13 Pruebe la hipotesis de que no hay asociacion entre poblaciones para el Ejemplo 15.12. 
Proporcione llmites para el valor p asociado. 

Solucion El valor critico de r s para una prueba de una cola con a = .05 y n = 8 es .643. Supongamos 
que no puede ser posible que una correlacion entre la clasificacion del juez y los rangos de 
calificaciones del examen de profesores sea positiva. (Rango bajo significa buena ensenanza 
y debe estar asociado con una alta calificacion del examen si el juez y el examen miden la 
capacidad de ensenanza.) La hipotesis alternativa es que el coeficiente de correlacion de rango 
poblacional p s es menor que cero, de modo que estamos interesados en una prueba estadfstica 
de una cola. Entonces, a para la prueba es el valor tabulado .05 y rechazamos la hipotesis nula 
si r s < -.643. 

El valor calculado del estadfstico de prueba, r s = -.714, es menor que el valor critico para 
a = .05. Como H 0 es rechazada para a = .05 pero no para a = .025, el valor p asociado con 
la prueba se encuentra en el intervalo .025 < valor p < .05. Por tanto, la hipotesis nula es 
rechazada con un nivel de significancia a = .05. Parece que existe algun acuerdo entre las 
clasificaciones del juez y las calificaciones del examen, pero este acuerdo podrfa existir aun 
cuando ninguna proporcione un criterio adecuado para medir la capacidad de ensenanza. Por 
ejemplo, la asociacion podrfa existir si el juez y quienes formularon el examen de los maestros 
tuvieran un concepto completamente erroneo, pero semejante, de las caracterfsticas de buena 
ensenanza. ■ 


Prueba de correlacion de rango de Spearman 

Hipotesis nula: H 0 : no hay asociacion entre los pares de rangos. 

Hipotesis alternativa : (1) H a : hay asociacion entre los pares de rangos (una prueba 
de dos colas), 

o bien, (2) la correlacion entre los pares de rangos es positiva (o negativa) (una 
prueba de una cola). 

Estadfstico de prueba: 

n R{ Xi )R{yd ~ [EU *(*/)] [EU 

rs - , 

y{« E'Utffe)] 2 - [E?=t *fe)] 2 } {" EU^yd? - [EU ^)f} 

donde R (v,) y R(y t ) denotan el rango de x ; entre x l ,x 2 ,..., x n y y, entre y,, y 2 ,, y n , 
respectivamente. 

Region de rechazo: Para una prueba de dos colas, rechazar H 0 si r s > r 0 o r s < 
-r 0 , donde r 0 se da en la Tabla 11, Apendice 3. Duplique la probabilidad tabulada 
para obtener el valor a para la prueba de dos colas. Para una prueba de una cola, 
rechace H 0 si r s > r 0 (para una prueba de cola superior) or s < —r 0 (para una prue¬ 
ba de cola inferior). El valor a para una prueba de una cola es el que se muestra 
en la Tabla 11, Apendice 3. 
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Ejercicios 

15.53 Se realizo un experimento para estudiar la relacion entre las clasificaciones hechas por calificadores de 
hojas de tabaco y el contenido de humedad de las hojas de tabaco correspondientes. Doce hojas fueron 
clasificadas por los calificadores en una escala de 1 a 10 y se hicieron las correspondientes mediciones 
de contenido de humedad en las mismas hojas. Los datos se muestran en la siguiente tabla. Calcule r s . 
^Los datos aportan suficiente evidencia para indicar una asociacion entre la clasificacion de los califica¬ 
dores y el contenido de humedad de las hojas? Explique. 


Hoja 

Clasificacionde 
los calificadores 

Contenido 

de humedad 

1 

9 

.22 

2 

6 

.16 

3 

7 

.17 

4 

7 

.14 

5 

5 

.12 

6 

8 

.19 

7 

2 

.10 

8 

6 

.12 

9 

1 

.05 

10 

10 

.20 

11 

9 

.16 

12 

3 

.09 


15.54 Es frecuente que los envasadores de alimentos perecederos usen conservadores para retardar el proceso 
de descompsicion. Una preocupacion es que demasiado conservador cambiara el sabor del alimento. Se 
realizo un experimento usando porciones de productos alimenticios y agregando cantidades variables 
de conservadores. Para cada porcion de alimento se registran el sabor y el tiempo para que el alimento 
empiece a descomponerse. La clasificacion de sabor es el promedio de clasificacion de tres jueces, 
cada uno de los cuales clasifico cada porcion de alimento en una escala de 1 (malo) a 5 (bueno). En la 
siguiente tabla se muestran doce mediciones. Use una prueba no parametrica para determinar si estan 
correlacionadas las clasificaciones de sabor y los tiempos de descomposicion. Proporcione el valor p 
asociado e indique la conclusion apropiada para una prueba con un nivel a = .05. 


Porcion de 

alimento 

Dias hasta su 
descomposicion 

Clasificacion 

de sabor 

1 

30 

4.3 

2 

47 

3.6 

3 

26 

4.5 

4 

94 

2.8 

5 

67 

3.3 

6 

83 

2.7 

7 

36 

4.2 

8 

77 

3.9 

9 

43 

3.6 

10 

109 

2.2 

11 

56 

3.1 

12 

70 

2.9 


15.55 Una gran empresa selecciona graduados para contratarlos usando entrevistas y un examen de aptitudes 
psicologicas. Las entrevistas realizadas en la casa matriz de la empresa fueron mucho mas costosas que 
el examen, que fue posible realizar en las universidades. En consecuencia, la oficina de personal estuvo 
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interesada en determinar si las calificaciones del examen estaban correlacionadas con clasificaciones 
de la entrevista y si los examenes pudieran ser sustituidos por entrevistas. La idea no era eliminar las 
entrevistas sino reducir su numero. Diez candidatos fueron clasificados durante las entrevistas y luego 
examinados. Las calificaciones pareadas se muestran en la siguiente tabla. 


Sujeto 

Calificacion de 
la entrevista 

Calificacion 
del examen 

1 

8 

74 

2 

5 

81 

3 

10 

66 

4 

3 

83 

5 

6 

66 

6 

1 

94 

7 

4 

96 

8 

7 

70 

9 

9 

61 

10 

2 

86 


a Calcule el coeficiente de correlacion de rangos de Spearman r s . El rango 1 se asigna al candidate 
considerado corno el mejor. 

b ^Los datos presentan suficiente evidencia para indicar que la correlacion entre las clasificaciones de 
la entrevista y las calificaciones del examen es menor que cero? Si existe esa evidencia, ^podemos 
decir que podrfan usarse examenes para reducir el numero de entrevistas? 

15.56 Un experto en ciencias polfticas deseaba examinar la relation entre la imagen del elector de un candi¬ 
date politico conservador y la distancia en millas entre el domicilio del elector y el del candidato. Cada 
uno de 12 electores califico al candidato en una escala de 1 a 20. Los datos resultantes se muestran en la 
tabla siguiente. 


Elector Calificacion Distancia 


1 

12 

75 

2 

7 

165 

3 

5 

300 

4 

19 

15 

5 

17 

180 

6 

12 

240 

7 

9 

120 

8 

18 

60 

9 

3 

230 

10 

8 

200 

11 

15 

130 

12 

4 

130 


a Calcule el coeficiente de correlacion de rangos de Spearman, r s . 

b ^Estos datos aportan suficiente evidencia para indicar una correlation negativa entre calificacion y 
distancia? 

15.57 Consulte el Ejercicio 15.12. Calcule el coeficiente de correlacion de rangos de Spearman para estos 
datos y pruebe H 0 : p s = 0 con un nivel de significance de 10%. 

15.58 La information que se presenta en la siguiente tabla mide la rigidez a la flexion y la torsion medida por 
pruebas de ingenierfa para 12 raquetas de tenis. 
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Raqueta 

Rigidez a 
la flexion 

Rigidez a 
la torsion 

1 

419 

227 

2 

407 

231 

3 

363 

200 

4 

360 

211 

5 

257 

182 

6 

622 

304 

7 

424 

384 

8 

359 

194 

9 

346 

158 

10 

556 

225 

11 

474 

305 

12 

441 

235 


a Calcule el valor del coeficiente de correlation de rangos r s entre rigidez a la flexion y rigidez a la 
torsion. 

b Use la prueba basada en el coeficiente de correlation de rangos para determinar si hay una relation 
positiva importante entre rigidez a la flexion y rigidez a la torsion. Use a = .05. 

15.59 Consulte el Ejercicio 11.4. Considere los valores en libros y auditados como variables aleatorias y prue- 
be la existencia de correlation positiva entre los dos mediante el uso del coeficiente de correlation de 
rango de Spearman. Establezca limites para el valor p asociado con la prueba. 

15.60 Consulte el Ejercicio 11.8. Tratando los valores de flujo y estaticos como variables aleatorias, pruebe la 
presencia de una correlation entre los dos usando el coeficiente de correlation de rangos de Spearman, 
con a = .10. 


15.11 Comentarios generales sobre las 

pruebas estadfsticas no parametricas 

Las pruebas estadfsticas no parametricas, presentadas en paginas anteriores representan solo 
unos cuantos de los numerosos metodos estadfsticos no parametricos de inferencia que exis- 
ten. Un conjunto mucho mas grande de procedimientos no parametricos, junto con ejemplos 
resueltos, se proporciona en los textos citados en las bibliograffas [por ejemplo, consulte la 
obra de Conover (1999), Hollander y Wolfe (1999) y Daniel (2000)]. Muchos de los proce¬ 
dimientos para pruebas de hipotesis no parametricos se pueden adaptar para proporcionar 
puntos asociados y estimadores de intervalos para parametros de localization y diferencias en 
estos. Tambien hay procedimientos no parametricos para manejar algunos de los problemas 
inferenciales asociados con el modelo lineal. 

Hemos indicado que los procedimientos de prueba no parametricos son particularmente 
litiles cuando las observaciones experimentales son susceptibles de ordenarse, pero no pueden 
ser medidas en una escala cuantitativa. Los procedimientos estadfsticos parametricos raras ve- 
ces se pueden aplicar a este tipo de datos. Por tanto, cualesquier procedimientos inferenciales 
deben estar basados en metodos no parametricos. 
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Una segunda aplicacion de los metodos estadfsticos no parametricos tiene que ver con la 
prueba de hipotesis asociada con poblaciones de datos cuantitativos, cuando exista incerti- 
dumbre respecto a la satisfaction de suposiciones acerca de la forma de las distribuciones 
poblacionales. ^Exactamente que tan utiles son los metodos no parametricos para esta situa¬ 
tion? Los metodos estadfsticos no parametricos son rapidos y con frecuencia llevan a una 
decision inmediata al probar hipotesis. Cuando las condiciones experimentales se desvfen 
sustancialmente de las suposiciones basicas que son el fundamento de las pruebas parametri- 
cas, las mediciones de respuesta a veces pueden ser transformadas para aliviar la condition, 
pero con frecuencia aparece una consecuencia desafortunada: la respuesta transformada ya no 
es significativa desde un punto de vista practico y el analisis de los datos transformados ya no 
responde a los objetivos del experimentador. El uso de metodos no parametricos a veces evita 
esta dificultad. Por ultimo, observe que innumerables metodos no parametricos son casi tan 
eficientes como sus similares parametricos cuando las suposiciones que sirven de base a los 
procedimientos parametricos son verdaderas; y, como ya antes observamos, podrfan ser mas 
eficientes cuando las suposiciones no se satisfacen. Estas razones sugieren que las tecnicas no 
parametricas desempenan un papel muy util en la metodologfa estadfstica. 
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Ejercicios complementarios 

15.61 A medida que los consumidores se interesan cada vez mas en tomar alimentos sanos, muchos productos 
“de dieta”, “sin grasa” o “sin colesterol” estan apareciendo en el mercado. A cinco miembros de un 
jurado, todos ellos expertos en nutricion y elaboracion de alimentos, se les pidio que clasificaran tres 
sustitutos de huevo con bajo contenido de colesterol con base en el gusto, aspecto, textura y si ellos 
comprarfan los productos. 7 Los datos de la siguiente tabla son las calificaciones de sabor (0 = bajo a 20 
= alto) de los jueces para los tres productos. 


Calificador 

Saludable 

Mezclados 

Huevos revueltos 

Dan Bowe 

16 

9 

7 

John Carroll 

16 

7 

8 

Donna Katzl 

14 

8 

4 

Rick O’Connell 

15 

16 

9 

Roland Passot 

13 

11 

2 


a ^Que diseno se utilizo en este experimento para probar el sabor? 

b ),Piensa usted que es probable que los datos satisfagan las suposiciones necesarias para poner en 
practica una teoria normal basada en ANOVA? 

c ^Los datos indican que hay diferencias importantes entre las respuestas para los diferentes sustitutos 
de huevo? Determine o proporcione un limite al valor p aproximado. 

15.62 Dos gastronomos, A y B, calificaron 20 comidas en una escala de 1 a 10. Los datos se muestran en la 
siguiente tabla. ^.Los datos dan suficiente evidencia para indicar que uno de los gastronomos tiende a 
dar calificaciones mas altas que el otro? Pruebe usando la prueba de signos con un valor de a cercano 
a.05. 


Comida A 

B 

Comida A 

B 

1 

6 

8 

11 

6 

9 

2 

4 

5 

12 

8 

5 

3 

7 

4 

13 

4 

2 

4 

8 

7 

14 

3 

3 

5 

2 

3 

15 

6 

8 

6 

7 

4 

16 

9 

10 

7 

9 

9 

17 

9 

8 

8 

7 

8 

18 

4 

6 

9 

2 

5 

19 

4 

3 

10 

4 

3 

20 

5 

5 


15.63 Refierase a la comparacion de calificaciones aplicadas por gastronomos a las comidas del Ejercicio 
15.62 y use la prueba de rangos con signos de Wilcoxon para determinar si los datos dan suficiente evi¬ 
dencia para indicar una diferencia en las calificaciones de los dos gastronomos. Pruebe usando un valor 
de a cercano a .05. Compare los resultados de esta prueba con los de la prueba de signos del Ejercicio 
15.62. ^Las conclusiones son consistentes? 


7. Fuente : Karola Sakelel, “Egg Substitutes Range in Quality” San Francisco Chronicle, 10 de febrero de 1993, p. 8. 
© 1993 San Francisco Chronicle. 
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15.64 En una investigacion de la conducta de exploracion visual de ninos sordos, se tomaron mediciones de 
la rapidez de movimiento de los ojos de nueve ninos sordos y de nueve que si escuchan. A partir de los 
datos dados en la tabla. ^hay suficiente evidencia para justificar la afirmacion de que las distribuciones 
de la rapidez de movimiento de los ojos difieren para ninos sordos A y ninos B que si escuchan? 


Ninos sordos 

A 

Ninos que sf escuchan 
B 

2.75 (15) 

.89(1) 

2.14(11) 

1.43 (7) 

3.23 (18) 

1.06 (4) 

2.07 (10) 

1.01 (3) 

2.49 (14) 

.94 (2) 

2.18 (12) 

1.79 (8) 

3.16(17) 

1.12 (5.5) 

2.93 (16) 

2.01 (9) 

2.20 (13) 

1.12 (5.5) 

Suma de rangos 126 

45 


15.65 Una comparacion de reaccion (en segundos) a dos estfmulos diferentes en un experimento psicologico 
de asociacion de palabras produjo los resultados de la siguiente tabla cuando se aplico a una muestra 
aleatoria de 16 personas. (,Los datos presentan suficiente evidencia para indicar una diferencia en la 
localization para las distribuciones de tiempos de reaccion para los dos estfmulos? Use el estadfstico U 
de Mann-Whitney y pruebe con a = .05. ( Nota : esta prueba fue realizada usando la prueba t de Student 
en el Ejercicio 13.3. Compare sus resultados.) 


Estfmulo 1 

Estfmulo 2 

1 

4 

3 

2 

2 

3 

1 

3 

2 

1 

1 

2 

3 

3 

2 

3 


15.66 Si (como en el caso de mediciones producidas por dos instrumentos bien calibrados) las medias de dos 
poblaciones son iguales, el estadfstico U de Mann-Whitney se puede usar para probar hipotesis relacio- 
nadas con varianzas poblacionales (o medidas de variabilidad mas generales) de la siguiente manera. 
A1 igual que en la Section 15.6, identifique la poblacion I como aquella de la cual se toma la muestra 
mas pequena. Clasifique la muestra combinada. Numere las observaciones clasificadas de afuera hacia 
adentro; esto es, el numero de observation mas pequeno, 1; el mas grande, 2; el siguiente al mas pe¬ 
queno, 3; el siguiente al mas grande, 4; y asf sucesivamente. Esta sucesion final de numeros induce un 
ordenamiento en los sfmbolos x (observaciones de la muestra I) y y (observaciones de la muestra II). Si 
°x < °z- uno esperarfa hallar una predominancia de las x con rangos altos y por tanto una suma relativa- 
mente grande de rangos para las observaciones x. Por el contrario, si > o%, casi todas las x tendrfan 
rangos bajos y la suma de los rangos de las observaciones x serfa pequena. 

a Dadas las mediciones de la siguiente tabla, producidas por instrumentos de precision bien calibra¬ 
dos, A y B, pruebe cerca del nivel a — .05 para determinar si el instrumento mas costoso B es mas 
preciso que el instrumento A. (Observe que esto implica una prueba de una cola.) Use la prueba U de 
Mann-Whitney. 
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Instrumento A 

Instrumento B 

1060.21 

1060.24 

1060.34 

1060.28 

1060.27 

1060.32 

1060.36 

1060.30 

1060.40 



b Pruebe usando el estadfstico F de la Seccion 10.9. 

15.67 Calcule la probabilidad de que U £ 2 para n l = n 2 — 5. Suponga que no hay empates y que H 0 es ver- 
dadera. 

15.68 Calcule la probabilidad de que la prueba T de Wilcoxon (Seccion 15.4) es menor o igual a 2 para n — 3 
pares. Suponga que no hay empates y que H 0 es verdadera. 

15.69 Para investigar posibles diferencias entre ritmos de produccion para tres lfneas de produccion que pro- 
ducen piezas similares, unos examinadores tomaron muestras aleatorias independientes de las cifras 
totales de produccion durante 7 dfas para cada lrnea. Los datos resultantes aparecen en la siguiente tabla. 
^Estos datos aportan suficiente evidencia para indicar algunas diferencias de localization para los tres 
conjuntos de cifras de produccion, con un nivel de significancia de 5%? 


Lrnea 1 

Lrnea 2 

Lrnea 3 

48 

41 

18 

43 

36 

42 

39 

29 

28 

57 

40 

38 

21 

35 

15 

47 

45 

33 

58 

32 

31 


15.70 a Suponga que una companfa desea estudiar la forma en que la personalidad se relaciona con el lide- 
razgo. Se seleccionan cuatro supervisores, I, II, III y IV, con diferentes tipos de personalidad. A con¬ 
tinuation se seleccionan varios empleados del grupo supervisado por cada uno y a estos empleados 
se les pide clasificar al lfder de su grupo en una escala de 1 a 20 (20 significa altamente favorable). La 
siguiente tabla muestra los datos resultantes. (,Hay suficiente evidencia para indicar que uno o mas de 
los supervisores tiende a recibir calificaciones mas altas que los otros? Use a — 0.05. 


I 

11 

III 

IV 

20 

17 

16 

8 

19 

11 

15 

12 

20 

13 

13 

10 

18 

15 

18 

14 

17 

14 

11 

9 


16 


10 


b Suponga que la companfa esta particularmente interesada en comparar las calificaciones de los tipos 
de personalidad representados por los supervisores I y III. Haga esta comparacion usando a = .05. 

15.71 Los lfderes de un sindicato obrero desean determinar las preferencias de sus miembros antes de negociar 
con la administration. Diez miembros del sindicato se seleccionan aleatoriamente y cada uno de ellos 
lleno un extenso cuestionario. Las respuestas a los diversos aspectos del cuestionario haran posible que 
el sindicato califique, en orden de importancia, los puntos a negociar. Las calificaciones muestrales se 
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ven en la siguiente tabla. ^Hay suficiente evidencia para indicar que uno o mas de los puntos se prefieren 
a otros? Pruebe usando a = .05. 


15.72 


Persona 

Mas salario 

Estabilidad 

laboral 

Prestaciones 

Menos horas 
de trabajo 

1 

2 

1 

3 

4 

2 

1 

2 

3 

4 

3 

4 

3 

2 

1 

4 

1 

4 

2 

3 

5 

1 

2 

3 

4 

6 

1 

3 

4 

2 

7 

2.5 

1 

2.5 

4 

8 

3 

1 

4 

2 

9 

1.5 

1.5 

3 

4 

10 

2 

3 

1 

4 


Se formaron seis grupos de tres ninos con IQ y edad comparables. A cada nino se le enseno el concepto 
de tiempo usando uno de tres metodos: lectura, demostracion o maquina de ensenanza. Las calificacio- 
nes mostradas en la siguiente tabla indican el aprovechamiento de los estudiantes cuando fueron exami- 
nados para ver lo bien que habfan entendido el concepto. ^Hay suficiente evidencia para indicar que los 
metodos de ensenanza difieren en efectividad? Establezca Ionites para el valor p. 


Grupo 

Lectura 

Demostracion 

Maquina de ensenanza 

1 

20 

22 

24 

2 

25 

25 

27 

3 

30 

40 

39 

4 

37 

26 

41 

5 

24 

20 

21 

6 

16 

18 

25 


15.73 Calcule P(R^ 6) para la prueba de corridas de ensayo, donde n 1 = n 2 = 8 y H 0 es verdadera. No use la 
Tabla 10, Apendice 3. 

15.74 Considere una prueba de suma de rangos de Wilcoxon para comparar dos distribuciones de probabilidad 
con base en muestras aleatorias independientes de n 1 = n 2 = 5. Encuentre P(W £ 17), suponiendo que 
H 0 es verdadera. 

*15.75 Para la muestra de la poblacion I, denote con U el estadfstico de Mann-Whitney y denote con W el 
estadfstico de suma de rangos de Wilcoxon. 8 Demuestre que 

U = rnn 2 +(l/2)n 1 (« 1 + 1) - W. 

*15.76 Consulte el Ejercicio 15.75. 

a Demuestre que E(U) = ( 1 /2)n t n 2 cuando H 0 es verdadera. 

b Demuestre que V(U) = (1/12 )[n l n->(n l + n 2 + 1)] cuando H 0 es verdadera, donde H 0 expresa que 
las dos poblaciones tienen distribuciones identicas. 

*15.77 Denote con T el estadfstico de rangos con signo de Wilcoxon para n pares de observaciones. Demuestre 
que E(T) = (1/4)«(« + 1) y V{T) = (l/24)[n(n + 1)(2 n + 1)] cuando las dos poblaciones son iden¬ 
ticas. Observe que estas propiedades no dependen de si T se construye a partir de diferencias negativas 
o positivas. 


8. Los ejercicios precedidos por un asterisco son opcionales. 








Ejercicios complementarios 795 


*15.78 Considere el coeficiente de correlation de rangos de Spearman de la Section 15.10. Demuestre que, 
cuando no hay empates en cualquiera de las observaciones x o las observaciones y, entonces 


n £"= i R(x,)R(yt) ~ [EU *(*)] [EU *(?.■)] 
r s - , — 

y{« EUWxM 2 ~ [EU *(*.-)] 2 ) {n EUWyM 2 ~ [EU ^(y-)] 2 } 

= 1 _ 6 EUd[ 

n(n 2 — 1)’ 

donded, = R(x t ) — R(yt). 
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16.1 Introduccion 


Iniciamos este capftulo con un ejemplo que ilustra los conceptos y una aplicacion de la pro- 
puesta de Bayes para hacer inferencias. Suponga que estamos interesados en estimar la proporcion 
de quienes responden a una nueva terapia para tratar una enfermedad que es grave y diffcil de 
curar (por ejemplo una enfermedad que se dice es virulenta). Si p denota la probabilidad 
de que cualquier persona con la enfermedad responda al tratamiento, el numero Y de quienes 
respondan en una muestra de tamano n podrfa suponerse razonablemente que tiene una distri¬ 
bucion binomial con parametro p. En capltulos previos hemos visto que el parametro p tiene 
un valor fijo pero desconocido y hemos examinado estimadores puntuales, estimadores de 
intervalo y pruebas de hipotesis para este parametro. Incluso antes de que recolectemos dato 
alguno, nuestro conocimiento de que la enfermedad es virulenta podrfa llevarnos a pensar 
que es probable que el valor de p sea relativamente pequeno, quiza en la proximidad de .25. 
( ',C6mo podemos usar esta informacion en el proceso de hacer inferencias acerca de pi 

Una forma de usar esta informacion previa acerca de p es utilizar un metodo de Bayes. En 
esta proposition modelamos la distribucion conditional de Y dad a p, Y\p, como binomial: 



y = 0, 1,2,..., n. 


La incertidumbre acerca del parametro p se maneja tratandolo como una variable aleatoria y, 
antes de observar cualquier dato, asignar una distribucion previa a p. Dado que sabemos que 
0 < P < 1 y que la funcion de densidad beta tiene un intervalo (0, 1) como apoyo, es conveniente 
usar una distribucion beta como previa para p. Pero, £cual distribucion beta deberfamos usar? 
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Como la media de una variable aleatoria con distribucion beta y parametros a y (3 es /jl = a/ 
(a + /3) y pensamos que p podria estar en la proximidad de .25, podriamos escoger usar una 
distribucion beta con a = 1 y fi = 3 (y pt = .25) como la previa para p. Por tanto, la densidad 
asignada a p es 

8(p) = jO ~P)\ 0<p<l. 

Como hemos especificado la distribucion condicional de Y\p y la distribucion de p, tambien 
hemos especificado la distribucion conjunta de ( Y , p) y podemos determinar la distribucion 
marginal de Y y la distribucion condicional dc p \ Y. Despues de observar Y = y, la densidad 
posterior de p dada Y = y, g*{p\y) se puede determinar. En la siguiente seccion deducimos 
un resultado general que, en nuestro ejemplo de una enfermedad virulenta, implica que la 
densidad posterior de p dada Y = y es 


g*(p\y) 


T(n +4) 

F(y + l)f(n — y + 3) 


p y(\ -pY~ y+2 , 


0< p<l. 


Observe que la densidad posterior para p \ y es una densidad beta con a = y + 1 y f} = n — y 
+ 3. Esta densidad posterior es la densidad “actualizada” (por los datos) de p y es la base para 
todas las inferencias bayesianas con respecto a p. En las siguientes secciones, describimos el 
metodo general de Bayes y especificamos como usar la densidad posterior para obtener esti- 
maciones, intervalos crefbles y pruebas de hipotesis para p y para parametros asociados con 
otras distribuciones. 


16.2 Bayesianos previos, posteriores y estimadores 

Si Fj, Y 2 ,..., Y n denotan las variables aleatorias asociadas con una muestra de tamano n , ya 
previamente usamos la notacion L(y v y 2 ,..., y n \ 6) para denotar la verosimilitud de la mues¬ 
tra. En el caso discreto, esta funcion esta definida como la probabilidad conjunta P(Y\ = 
y |, Yo = yo,, Y„ = y„) y, en el caso continuo, es la densidad conjunta de Pj, Y 2 , ..., Y n 
evaluada en y v y 2 ,..., y n . El parametro 6 esta incluido entre los argumentos de L (v,, y 2 , ■ ■ ■, 
y n 1 6) para denotar que esta funcion depende explfcitamente del valor de algun parametro 6. 
En el metodo bayesiano, el parametro desconocido 0 se ve como una variable aleatoria con 
una distribucion de probabilidad, llamada distribucion previa de 6. Esta distribucion previa se 
especifica antes de recolectar cualquier informacion y da una descripcion teorica de la infor- 
macion acerca de 6 de la que se disponfa antes de obtener cualquier dato. En nuestro analisis 
inicial supondremos que el parametro 6 tiene una distribucion continua con densidad g(8) que 
no tiene parametros desconocidos. 

Usando la probabilidad de los datos y la previa sobre 9, se deduce que la probabilidad 
conjunta de fj, Y 2 ,..., Y n , 6 es 


f(yu y’ 2 , ■■■, y„,0) = L(y 1 , y 2 ,..., y n I 0) X g(6) 


y que la densidad marginal o funcion de masa de Y v Y 2 ,..., Y n es 


m(yu yi,..., y n ) 



L(yi,y 2 ,..., y n \6) Xg(9)d0. 
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Solucion 


Finalmente, la densidad posterior de 0\y x , y 2 , ■ ■ •, >'„ es 


g'*(0 | y u y 2 ,..., y n ) 


Ljyuyi,---, ?«!#) Xg(6) 

f -«, L(yu yi, • • •, y« 1 0) x g(0) de 


La densidad posterior resume toda la informacion pertinente acerca del parametro 6 al 
hacer uso de la informacion contenida en la densidad previa para 9 y la informacion de los 
datos. 


Denotemos con Y v Y 2 ,..., Y n una muestra aleatoria de una distribucion de Bernoulli donde 
P{Y t = 1) = p y P(Y l = 0) = 1 —p y supongamos que la distribucion previa para p es beta ( a, 
(3). Encuentre la distribucion posterior para p. 


Como la funcion de probabilidad de Bernoulli se puede escribir como 


p(y t \p) = />*0 ~p) l ~ yi , yi =o, i. 


la probabilidad L(y x , y 2 , ... ,y„\p ) es 

L(yu yi,■■■, y„ I p) = p{y i, yi,■■■, y n I p) 

= p yi ( 1 - p) l ~ yi X p y m - p)'~ yi X- • ■ X p y "( 1 - p) l ~ y " 
= p^ y ‘(l — p) n ~^ yt , yt = 0, 1 y 0<P< 1. 


Entonces, 


y 


f(yu >’ 2 , • • •, y n , p) 


L(y i, y2.y« | p) x g(» 

p Ey. ( i _ p)«-E,v. x T( - a+ P> «- 1 (1 _ 

^ ^ r(a)r( y s) i F 


r(o! + /3) y yi+a _i 

r(«)rosr 


Vi+/3~1 


y2:• • •, y„) = f ——— —p£y> +a *(i — p) ,! E^.+z 3 1 dp 

= r(a + P) r( ^ V,- + a)r(n - E Yi + ff) 

r(a)r(^) r(n+a+/3) 


Finalmente, la densidad posterior de p es 


g*(p I yu y 2 ,..., y„) 


r(« + /3) _ y,-2>+/3-l 

r(o;)r( j 6) _ 

r(a + /3) r (XI y; + a) r (» - E yi + 0)' 

r(a)r(j 3 ) r(n+a+/ 3 ) 

_ r (n +a +/3) _ x 

r (E y, + a)r(n-J 2 yi + P) 

pY.yi +a ~ x (\ - p) n ~ E>’.+^- 1 j 


0 </? < 1 


0</7<l, 


una densidad beta con parametros a* 


E yt + « y P*= n - 'Eyi + P- 
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Antes de continuar, veamos algunas de las implicaciones del resultado del Ejemplo 16.1. 
En el siguiente ejemplo compararemos las distribuciones previa y posterior para algunas (por 
ahora) elecciones arbitrarias de los parametros de la distribution previa y los resultados del 
experimento. 


EJEMPLO 16.2 Considere la situation de la enfermedad virulenta y los resultados del Ejemplo 16.1. Compare 
las distribuciones previa y posterior del parametro p de Bernoulli (la proportion de quienes 
responden a la nueva terapia) si escogemos los valores para a y (3 y observamos la informa¬ 
tion hipotetica dada a continuacion: 

a a = 1, /3 = 3 , n = 5 , £ y t = 2. 

b a = 1, /3 = 3, n = 25, £ y,- = 10. 

C a = 10 , p = 30 , n = 5 , £ y,- = 2. 

d a = 10, P = 30, n = 25 , £ y t = 10. 


Solution Antes de continuar, observe que ambas distribuciones previas beta tienen media 


a 1 

a+p ~ 1 + 3 


10 

10 + 30 


= .25 


y que ambas muestras hipoteticas resultan en el mismo valor de las estimaciones de probabi- 
lidad maxima (MLE) para p: 


P = 




Como se dedujo en el Ejemplo 16.1, si y v y 2 ,..., y n denotan los valores en una muestra 
aleatoria de una distribution de Bernoulli, donde P(Y i = 1) = p y P(Y i = 0) = I - p v 
la distribution previa para p es beta (a, /3), la distribution posterior para p es beta (a* = 
Jj v, + a, 16 * = n — ^2 >'i + P). Por tanto, para las opciones de este ejemplo. 


a cuando la distribution previa es beta (1, 3), n = 5, = 2, la distribution posterior es 

beta con 

a* = ^ y t + a = 2 + 1=3 y P* = n — ^ y t + /3 = 5 — 2 + 3 = 6. 


b cuando la distribution previa es beta (1, 3), n = 25, ^ y,- = 10, la distribution posterior es 
beta con 

a* = 10+1=11 y p* =25 — 10 + 3 = 18. 


c cuando la distribution previa es beta (10, 30), n = 5, ]+ v, = 2, la distribution posterior es 
beta con 

a* =2+10= 12 y /3* = 5 — 2 + 30 = 33. 


d 


cuando la distribution previa es beta (10, 30), n 
es beta con 

a* = 20 y 


= 25,E + 

P* = 45. 


10, la distribution posterior 


Recuerde que la media y varianza de una variable aleatoria con distribution beta (cr, ft) son 

a t _ a/3 

M “ a+P y ° (a + P) 2 (a + P + \)' 

Los parametros de las distribuciones previas y posteriores beta, junto con sus medias y varian- 
zas se resumen en la Tabla 16.1. La figura 16.1(a) contiene graficas de las distribuciones beta 
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Tabla 16.1 Distribuciones previas y posteriores beta para el Ejemplo 16.2 

Distribucion 

n 

2> 

Parametros de 

distribucion beta 

Media 

Varianza 

Previa 

— 

— 

a = 1, p = 3 

.2500 

.0375 

Posterior 

5 

2 

a = 3, /3* = 6 

.3333 

.0222 

Posterior 

25 

10 

a* = 11, p* = 18 

.4074 

.0078 


Previa 

— 

— 

a = 10, P 

= 30 

.2500 

.0046 

Posterior 

5 

2 

a* = 12, P* 

= 33 

.2667 

.0043 

Posterior 

25 

10 

d * = 20, p* 

= 45 

.3077 

.0032 


FIGURA 16.1 
Graficas de distri- 
buciones previas y 
posteriores beta en el 
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1.0 


























16.2 Bayesianos previos, posteriores y estimadores 801 


DEFINICION 16.1 


DEFINICION 16.2 


EJEMPLO 16.3 


Solucion 


(previas y posteriores) asociadas con la previa beta con parametros a = 1, /3 = 3. Las graficas 
de las distribuciones beta asociadas con la previa beta (10, 30) se dan en la Figura 16.1(b). ■ 


En los Ejemplos 16.1 y 16.2 obtuvimos densidades posteriores que, como la previa, son 
densidades beta con valores de parametro alterados (por los datos). 


Las distribuciones previas que resulten en distribuciones posteriores que sean de la mis- 
ma forma funcional que la previa, pero con valores de parametro alterados, se denomi- 
nan previas conjugadas. 


Cualquier distribucion beta es una distribucion previa conjugada para una distribucion de 
Bernoulli (o una binomial). Cuando la previa se actualiza (usando los datos), el resultado es 
una beta posterior con valores de parametro alterados. Esto es conveniente desde el punto 
de vista computacional porque podemos determinar la formula exacta para la posterior y de 
ahi en adelante usar propiedades previamente desarrolladas de una distribucion conocida. 
Para las distribuciones que usamos en este capftulo, hay previas conjugadas asociadas con 
los parametros relevantes. Es frecuente que estas familias de previas conjugadas se vean lo 
suficientemente claras para manejar casi todas las situaciones practicas. Como resultado, las 
previas conjugadas se usan frecuentemente en la practica. 

Como la posterior es una funcion de densidad de probabilidad de buena fe, algun resumen 
caracterfstico de esta densidad da una estimacion para 6. Por ejemplo, podrfamos usar la me¬ 
dia, la mediana o la moda de la densidad posterior de nuestro estimador. Si estamos interesa- 
dos en estimar alguna funcion de 6 , por ejemplo t(6), usaremos el valor esperado posterior de 
t{6) como nuestro estimador para esta funcion de 0. 


Sea yj, Y 2 ,..., Y n una muestra aleatoria con funcion de verosimilitud L(y l? y 2 , ■ ■ ■, y n \0), 
y que 6 tenga densidad previa g(9). El estimador posterior de Bayes para t{0) esta dado 
por 

m B =E{m\Y l ,Y 2 ,..., y„). 


En el Ejemplo 16.1 encontramos la distribucion posterior del parametro p de Bernoulli basado 
en una previa beta con parametros (a, /3). Encuentre los estimadores de Bayes para p y p (1 - 
p). [Recuerde que p (1 —p) es la varianza de una variable aleatoria de Bernoulli con parametro 
Pi 


En el Ejemplo 16.1 encontramos que la densidad posterior de p es una densidad beta con 
parametros a* = y ; + a y (3* = n — y t + /3: 


g*{p\yuyi,---, y„) 


r(«* +/3») , 
r(o!*)r (p*) p 


'(i -p) 


/3*-l 


0 < p < 1. 
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La estimation de p es la media posterior de p. De nuestro estudio previo de la distribution 
beta, sabemos que 

p B = E(p\yi,y 2 ,..., y„) 

a* 

a* + /3* 

= _ E yt +a _ = E yt + a 

E yt + a + n - E yt + P « + a + /3 

Del mismo modo, 


[P( 1 ~P)]B 


E(p (l - p) | yu yi,---, y n ) 

r(a* + j8*) x r(a* + i)r(yS* + i) 


L 

l 


X 


r(a* +13* +2) 

a*r(a*)P*r(P*) 


r(a*)r(/3*) 
r(a* + f3*) 

r(ot*)r(/3*) (a* + p* + l)(a* + p*)F(a* + P*) 

a*p* 

(a* + P* + 1) (a* + P*) 


(E yt + a ) (» ~ E yt + P) 

(n + a + P + \) (n + a + P) 


Por tanto, los estimadores de Bayes para p y p (1 —p) son 


T,Y,+a 
n + a + P 


y [p(i ~ p)]b 


(E^- +«)(” ~E*/ +/ 3 ) 

(« + a + P + 1) (« + a + P) | 


Un examen mas a fondo del estimador de Bayes para p dado en el Ejemplo 16.3 da como 
resultado 


E*.- 

n + a + p 

n \ / E + f a +P \ ( a 

n + a + P) \ n ) \n + a + P j \a + P 

——W+f ° +<3 )(— 

n + a + P ) \n + a + P J \a + P 

Entonces, vemos que el estimador de Bayes para p es un promedio ponderado de la media 
muestral, Y (la MLE para p) y la media de la previa beta asignada a p. Observe que la media 
previa de p recibe menos valor para tamanos muestrales mas grandes, mientras que el valor 
dado a la media muestral aumenta para tamanos muestrales mas grandes. Tambien, como 
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E(Y) = p, es facil ver que el estimador de Bayes para p no es un estimador insesgado. En 
terminos generales, los estimadores de Bayes no son insesgados. 

Observe que los estimadores obtenidos en el Ejemplo 16.3 son funciones del estadfstico 
suficiente Y E- Esta no es coincidencia puesto que un estimador de Bayes es siempre una 
funcion de un estadfstico suficiente, resultado consecuencia del criterio de factorization (vea 
Teorema 9.4). 

Si U es un estadfstico suficiente para el parametro 0 basado en una muestra aleatoria Vj, 
Y 2 ,..., Y n , entonces 


L(yi,y 2 ,..., y n \0 ) = k(u,6) X h(yu y 2 ,..., >’«), 


donde k ( u, 0) es una funcion solo de u y 0 y h (y,, y 2 ,... ,y n ) no es una funcion de 0. Ademas 
(vea Hogg, McKean y Craig, 2005), la funcion k {u, 0) puede (pero no necesita) ser escogida 
para ser la funcion de probabilidad de masa o densidad del estadfstico U. De acuerdo con la 
notation de este capftulo, escribimos la densidad condicional de U \ 0 como k (u \ 0). Entonces, 
como h (y,, y 2 ,..., y n ) no es una funcion de 0, 


8*(0 | yi, , y n ) 


L(y x ,y 2 ,..., y n j_g) Xg(0) 

fZo >' 2 , • ■ •, y n I 0) X g(G) d0 


k{u | 0) X h (yi, y 2 ,..., y n ) X g{0) 
f-oo k ( u I 0 ) X h(yi, y 2 ,, y„) Xg(0)d0 

k(u \0) X g(0) 

JZk(u\0)Xg(0)d0 ' 


Por tanto, en casos donde se conozca la distribucion de un estadfstico U suficiente, la poste¬ 
rior se puede determinar usando la densidad condicional de U \ 0. Ilustramos con el siguiente 
ejemplo. 


EJ EMPLO 16.4 Denotemos con ¥j, Y 2 ,..., Y n una muestra aleatoria de una poblacion normal con media p, 
desconocida y varianza <Tp conocida. La distribucion previa conjugada para p es una distribu¬ 
cion normal con media 17 conocida y varianza S 2 conocida. Encuentre la distribucion posterior 
y el estimador de Bayes para p. 

Solucion Como U = Y^i es un estadfstico suficiente para py se sabe que tiene una distribucion nor¬ 
mal con media np y varianza nap. 


L(u\p) = 




=exp 


2na} 


(u — np) 


-00 < u <00 


y la densidad conjunta de U y p es 

f(u,p) = L(u\p) Xg(p) 
1 


. exp 


Y 277/7 a 2 V27 t8 2 

- 00 <u< 00 , - 00 <p< 00 . 
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Veamos la cantidad en el exponente de arriba: 


1 , 1 , 
— (m -nfi) ~ j(/i - 17 ) 


2 «cr? v r ' 28 2 

1 


9 2g2 [S 2 (« - «/a ) 2 + «o- 2 (M - i?) 2 ] 

-— [SV — 2 8 2 unfi + 8 2 h 2 /jL 2 + na 2 fi 2 — 2na 2 jir\ + Her 2 ?} 2 ] 

2 no%8 2 L 

2w j. 2g2 [(« 2 S 2 + «cr 2 )/x 2 - 2 (nS 2 u + na 2 r])ji + SV + ncr 2 ?/ 2 ] 


[(«S 2 + o- 2 )/j , 2 - 2 ( 8 2 u + (r 2 r])ii] - ^ ( 5 2 » 2 + ncr 2 rf) 


2a 2 8 2 


2 na 2 8 2 


n8 2 + a 2 
’ 2a 2 S 2 


jj? -2 


1 

2 na 2 8 2 


2 \ 21 


5 2 m + <j 2 ti\ ( 8 2 u + rryr? 
h5 2 + a-2 + ( n s 2 + 0-2 


22 , 27 n{ 8 2 u + <J 2 r ]) 2 n 

o u “r na~rr — ----— 

° ' n 8 2 + a 2 


Finalmente, obtenemos: 

1 


1 


2na 2 


(u -nit) ~ ^(fi -T?) = — 


8 2 + a 2 / 8 2 u + a 2 rj 


2a 2 8 2 




1 


2 (n 2 8 2 + Her 2 ) 


iS 2 + a 2 


(u — nrj) . 


Por tanto, 


f(u,ii) = 


1 


y/2Truer 2 \/2 tt8 2 
1 

^firmer 2 \Z2 tt8 1 
X exp 


exp 


exp 


n8 2 + a 2 / 8 2 u + — 2 -\ 2 


2 o- 2 S 2 

1 






n8 2 + a 2 


2 {n 2 8 2 + na 2 ) 


(it — nrj) 


exp 


m(u) = ■ 


1 


2 {n 2 8 2 + ncr 2 ) 


(u — nrj) 


exp 


^/2mia 2 \Z2 v8 2 
1 


2 (n 2 8 2 + na 2 ) 


(u — nr)) 


y/2irn(n8 2 + a 2 ) 


f 

l /-‘ 


exp 


exp 


n8 2 + a 2 ( 8 2 u + a 2 r) w 


2 a-2 S 2 




n8 2 + a 2 


n8 2 + a 2 ( 8 2 u + a 2, x 2 


2a 2 8 2 




r 1 ? 


n 8 2 + a 2 


2tto 2 8~ 
n8 2 + a 2 


dji 


dfi. 
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Si reconocemos esta integral como la de una funcion de densidad normal y por tanto igual a 
1, obtenemos que la funcion de densidad marginal para U es normal con media mq y varianza 
( n 2 8 2 + ncr 2 ). Ademas, la densidad posterior de f± dada U = m es 


n8 2 + cr 2 / 8 2 u + cr 2 Tq\ 

2 cr 2 8 2 V n8 2 + cr 2 ) 

- oo< /x< oo , 

una densidad normal con media 


1 «) = 


/(m, /x) 

m(u) 


j 2iro^8 2 
V n8 2 +cr;} 


exp 


( &u+oZ-n \ 
V nS2 + a o J 


y 


varianza 


5*2 = 


( A 

\n8 2 + cr 2 ) 


Se deduce que el estimador de Bayes para /jl es 


_ 8 2 U + a 2 r] 
n8 2 + cr 2 


n8 2 — 


n8 2 + cr 2 


-Y + 


18 2 + 




De nuevo, este estimador de Bayes es un promedio ponderado de la UME, Y, la media mues- 
tral y la media de la previa 17 . Cuando aumenta el tamano de la muestra n. el valor asignado a 
la media muestral Y aumenta mientras que el valor asignado a la media previa 17 disminuye. 


Ejercicios 

16.1 Consulte los resultados del Ejemplo 16.2 dados en laTabla 16.1. 
a 7 ,Cual de las dos previas tiene la menor varianza? 

b Compare las medias y varianzas de las dos posteriores asociadas con la previa beta (1,3). 7 ,Cual de las 
posteriores tiene media y varianza que difiere mas de la media y la varianza de la previa beta (1, 3)? 
c Conteste las preguntas de los incisos a y b para la previa beta (10, 30). 

d 7 ,Sus respuestas a los incisos a-c estan apoyadas por las graficas presentadas en la Figura 16.1(a) y 

(b>? 

e Compare las posteriores con base en n = 5 para las dos previas. 7 ,Cual de las dos posteriores tiene 
media y varianza que difiere mas de la media y varianza de las previas correspondientes? 

16.2 Defina lo siguiente: 

a Distribucion previa para un parametro 6. 
b Distribucion posterior para un parametro 0. 
c Distribucion previa conjugada. 
d Estimador de Bayes para una funcion de 8, t(d) 

16.3 Ejercicio Applet La aplicacion Binomial Revision se puede usar para explorar el impacto de los datos 
y la previa sobre la distribucion posterior del parametro p de Bernoulli. La demostracion en la parte 
superior de la pantalla utiliza la previa beta con a = /3 = 1. 
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a Haga clic en el boton “Next Trial” para observar el resultado de tomar una muestra de tamano n = I 
de una poblacion de Bernoulli con p = .4. ^Observo un exito o un fracaso? ^La posterior se ve dife- 
rente a la previa? ^Los parametros de la posterior son lo que se esperaba con base en los resultados 
teoricos del Ejemplo 16.1? 

b Haga clic en el boton “Next Trial” una vez mas para observar el resultado y tomar una muestra de ta¬ 
mano total n = 2 de una poblacion de Bernoulli conp = .4. ^Cuantos exitos y fracasos ha observado 
usted hasta ahora? ^La posterior se ve diferente de la posterior que usted obtuvo en el inciso a? ^Los 
parametros de la posterior son lo que usted esperaba con base en los resultados teoricos del Ejemplo 
16.1? 

c Haga clic en el boton “Next Trial” varias veces para observar el resultado de tomar muestras de tama- 
nos mas grandes de una poblacion de Bernoulli conp = .4. Ponga atencion a la media y la varianza 
de la distribucion posterior que obtuvo al tomar muestras sucesivamente mas grandes. ^Que observa 
acerca de los valores de las medias de las posteriores? ^Que observa acerca de las desviaciones es- 
tandar de las posteriores basadas en tamanos muestrales mas grandes? 

d En la demostracion inicial de la aplicacion se le comunico que el verdadero valor del parametro de 
Bernoulli es p = .4. La media de la previa beta con a = (3 = 1 es .5. ^Cuantos intentos son necesarios 
para obtener una posterior con media cercana a .4, el verdadero valor del parametro de Bernoulli? 

e Haga clic en el boton “50 Trials” para ver el efecto de los resultados de 50 intentos adicionales a 
la posterior. ^Que observa usted acerca de la forma de las distribuciones posteriores con base en un 
numero grande de intentos? 

1 6.4 Ejercicio Applet Arrastre el cursor a la seccion “Applet with Controls” en la aplicacion Binomial 
Revision. AquL el usuario puede establecer el verdadero valor del parametro p de Bernoulli para cual- 
quier valor 0 < P < 1 (cualquier valor de interes “real”) y puede seleccionar cualquier a > 0 y [3 > 0 
como los valores de los parametros de la previa beta conjugada. ^Que pasara si el verdadero valor de p = 
.1 y se selecciona una previa beta con media 1 /4? En el Ejemplo 16.1, uno de estos conjuntos de valores 
para a y f3 se ilustro: a = 1, /3 = 3. Inicie la aplicacion para simular muestreo de una distribucion de 
Bernoulli con p = .1 y use la previa beta (1,3). (Asegurese de presionar Enter despues de introducir los 
valores apropiados en las cajas.) 

a Haga clic en el boton “Next Trial” para observar el resultado de tomar una muestra de tamano n = 1 de 
una poblacion de Bernoulli con p = .1. ^Observo un exito o un fracaso? ^La posterior se ve diferente 
a la previa? 

b Haga clic en el boton "Next Trial” una vez mas para observar el resultado y tomar una muestra de ta¬ 
mano total n = 2 de una poblacion de Bernoulli con p = . 1. ^Cuantos exitos y fracasos ha observado 
hasta ahora? ^La posterior se ve diferente de la posterior que usted obtuvo en el inciso a? 

c Si observo un exito en cualquiera de los dos primeros intentos, haga clic en el boton “Reset” y ern- 
piece de nuevo. A continuacion, haga clic en el boton "Next Trial” hasta que observe el primer exito. 
^Que le ocurre a la forma de la posterior al observar el primer exito? 

d En esta demostracion supusimos que el verdadero valor del parametro de Bernoulli es p = .1. La 
media de la beta previa con a = 1, [} = 3 es .25. Haga clic en el boton “Next Trial” hasta que obtenga 
una posterior que tenga media cercana a .1. ^Cuantos intentos son necesarios? 

1 6.5 Repita las instrucciones del Ejercicio 16.4, usando una beta previa con a = 10, /3 = 30. ^Como se com¬ 
pare el numero de intentos necesarios para obtener una posterior con media cercana a . 1 con el numero 
que el lector encontro en el Ejercicio 16.4(d)? 

16.6 Suponga que Y es una variable aleatoria binomial basada en n intentos y probabilidad de exito p (este es 
el caso para el ejemplo de una enfermedad virulenta de la Seccion 16.1). Use la beta previa conjugada 
con parametros ay [3 para deducir la distribucion posterior de p \ y. Compare esta posterior con la halla- 
da en el Ejemplo 16.1. 
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16.7 En la Seccion 16.1 y el Ejercicio 16.6, consideramos un ejemplo donde el numero de quienes responden 
a un tratamiento para una enfermedad virulenta en una muestra de tamano n, tuvieron una distribucion 
binomial con parametro p y se uso una beta previa para p con parametros a = 1 y /3 = 3. 

a Encuentre el estimador de Bayes para p = la proportion de quienes tienen la enfermedad virulenta 
que respondieron a la terapia. 

b Deduzca la media y la varianza del estimador de Bayes halladas en el inciso a. 

16.8 Consulte el Ejercicio 16.6. Si Y es una variable aleatoria binomial basada en n intentos y probabilidad p 
de exito y p tiene la beta previa conjugada con parametros a = 1 y (3 = 1, 

a determine el estimador de Bayes para p, Pb- 

b ^cual es el otro nombre para la distribucion beta con a = ly/3 = 1?, 

c encuentre la media cuadratica de error (MSE) del estimador de Bayes hallada en el inciso a. 
[Sugerencia: recuerde el Ejercicio 8.17], 

d ^Para que valores de p es la media cuadratica de error del estimador de Bayes menor que la del esti¬ 
mador insesgado p = Y/nl 

16.9 Suponga que realizamos intentos de Bernoulli independientes y registramos Y, el numero del intento en 
el que ocurre el primer exito. Como ya vimos en la Seccion 3.5, la variable aleatoria Y tiene una distri¬ 
bucion geometrica con probabilidad p de exito. Una distribucion beta es de nuevo una previa conjugada 
para p. 

a Si escogemos una previa beta con parametros ay (3, demuestre que la distribucion posterior de p \ y 
es beta con parametros a* = a + ly (3* = (3+y — 1. 

b Encuentre los estimadores de Bayes para p y p(l - p). 

16.10 Denote con Ej, Y 2 ,... , Y n una muestra aleatoria de una poblacion exponencialmente distribuida con den- 
sidad f(y \ 8) = 8e~ 6y , 0 < y. (Nota: la media de esta poblacion es p = 1 /6). Use la previa conjugada 
gamma (a, (3) para 8 para hacer lo siguiente. 
a Demostrar que ladensidad conjuntade Y 1 , Y 2 ,..., Y n , 6 es 


f(y i, yiy,„0) 


Qn+a —1 

T{a)P a 


exp 



P 

PHyt+iJl 


b Demostrar que la densidad marginal de Y v Y 2 ,...,Y n es 


m(yu y n ) 


r (n + a) / 

I»/3“ VjSEtf + l/ 


c Demostrar que la densidad posterior para 0| (v x , y 2 , ■ ■ ■, y n ) es una densidad gamma con parametros 
a* = n + a y f3* = (3 /(/3 ^y,- + l). 

d Demostrar que el estimador de Bayes para p, = 1/0 es 


Pb = 


Hr, 

n + a — 1 


1 

(3(n + a — 1) 


[Sugerencia: recuerde el Ejercicio 4.111(e).] 

e Demostrar que el estimador de Bayes del inciso d se puede escribir como un promedio ponderado de 
Y y la media previa para 1 /0. [Sugerencia: recuerde el Ejercicio 4.111(e).] 

f Demostrar que el estimador de Bayes del inciso d es un estimador sesgado pero consistente para p 
= 1 / 8 . 
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16.11 Denote con Y v Y 2 ,..., Y n una muestra aleatoria de una poblacion con distribucion de Poisson con media 
A. En este caso, U = E es un estadistico suficiente para A, y U tiene una distribucion de Poisson con 
media n\. Use la previa conjugada de gamma (a, p ) para A para hacer lo siguiente. 


a Demostrar que la verosimilitud conjunta de U, A es 


L(u, A) 


u\/3 l T(a) 


exp 



b Demostrar que la funcion marginal de masa de U es 


m(u) 


nT(u + a) / p y + “ 
u\p a r{a) \np + 1 ) 


c Demostrar que la densidad posterior para A | u es una densidad gamma con parametros a* = u + a y 
jB*=j8/(#i/3 + l). 

d Demostrar que el estimador de Bayes para A es 

, __ {J2Yi+a)p 

Afi “ np + 1 ' 

e Demostrar que el estimador de Bayes del inciso d se puede escribir como un promedio ponderado de 
Y y la media previa para A. 

f Demostrar que el estimador de Bayes del inciso d es un estimador sesgado pero consistente para A. 

16.12 Denote con Y v Y 2 ,..., Y n una muestra aleatoria de una poblacion normal con una media conocida 

y varianza desconocida 1/v. En este caso, U = — /r D ) 2 es un estadistico suficiente para v, y 

W = vU tiene una distribucion x 2 con n grados de libertad. Use la previa conjugada gamma (a, /3) para 
v para hacer lo siguiente. 

a Demostrar que la densidad conjunta de U, v es 


/O.v) 


u (n/2)-l v (n/2)+a-l r / / 2j 6 \ 

T(a)T(n/2) p «2("/ 2 > eXP |_ _V / \up +2 ) 


b Demostrar que la densidad marginal de U es 

/ ip y n/2)+ “ 

m(U) ~ r(a)r (n/2)P a 2^' 2) \ 1 <P +2 ) 

c Demostrar que la densidad posterior para vlu es una densidad gamma con parametros a* = (n/2) + 
a y p* = 2 p/(up + 2). 

d Demostrar que el estimador de Bayes para cr 1 = 1/v es <xj = ( Up + 2)/[y3 (n +2a — 2)]. [Suge- 
rencia: recuerde el Ejercicio 4.111(e).] 

e La MLE para cr 2 es U / n. Demuestre que el estimador de Bayes del inciso d se puede escribir como 
un promedio ponderado de la MLE y la media previa de 1 /v. [Sugerencia: recuerde el Ejercicio 
4.111(e).] 



16.3 Intervalos crefbles de Bayes 

En secciones previas hemos determinado como deducir intervalos de confianza clasicos para 
varios parametros de interes. En nuestra proposicion previa, el parametro de interes 0 tenia un 
valor fijo pero desconocido. Construimos intervalos al hallar dos variables aleatorias 8i y du, 
los Hmites de confianza inferior y superior, tales que 8l< 8u y de modo que la probabilidad 
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de que el intervalo aleatorio (0/ , §u) encerrara el valor fijo de 0 era igual al coeficiente de 
confianza prescrito 1 - a. Tambien consideramos como formar regiones de confianza unilate- 
rales. La realization clave en nuestro trabajo antes de Bayes fue que el intervalo era aleatorio 
y el parametro era fijo. En el Ejemplo 8.11 construimos un intervalo de confianza para la me¬ 
dia de una poblacion normalmente distribuida con varianza desconocida usando la formula 


Y ± t a /2 





En este caso los puntos extremos superior e inferior del intervalo son claramente variables 
aleatorias. Al obtener los datos, calculando los valores realizados de la media muestral 
y = 2959 y la varianza muestral s = 39.1 y usando n = 8 y f 025 = 2.365, determinamos que 
nuestro intervalo de confianza realizado para la velocidad media en la boca del canon para 
granadas del tipo considerado es (2926.3, 2991.7). Este es un intervalo fijo que contiene la ver- 
dadera velocidad media en la boca del canon o no la contiene. Decimos que es un intervalo de 
confianza de 95% porque si se tomaran muestras independientes y separadas, cada una 
de tamafio n = 8 y se determinaran los intervalos resultantes (diferentes), a la larga, 95% de 
los intervalos contendnan la verdadera media. El parametro es fijo, los puntos extremos del 
intervalo son aleatorios y diferentes muestras daran intervalos realizados diferentes. 

En el contexto de Bayes, el parametro 0 es una variable aleatoria con funcion de densidad 
posterior g*(0). Si consideramos el intervalo ( a , /;), la probabilidad posterior de que la varia¬ 
ble aleatoria 0 se encuentre en este intervalo es 


P\a < 0 < b) = f g*(0) d0. 

J Cl 

Si la probabilidad posterior P*{a < 0 < b) = .90, decimos que (a, b ) es un inten’alo crei'ble 
de 90% para 0. 


EJEMPLO 16.5 En el Ejemplo 8.11 fue razonable suponer que las velocidades en la boca del canon esta- 
ban normalmente distribuidas con media desconocida pi. En ese ejemplo supusimos que la 
varianza de las velocidades en la boca del canon cr 2 era desconocida. Suponga ahora que 
estamos interesados en formar un intervalo crefble de Bayes para p y suponemos que hay 
una alta probabilidad de que las velocidades en la boca del canon estaran a no mas de 30 pies 
por segundo de la media p. Debido a que una poblacion normalmente distribuida es tal que 
aproximadamente 95% de sus valores estan a no mas de 2 desviaciones estandar de su media, 
podria ser razonable suponer que la distribution fundamental de velocidades en la boca del 
canon esta normalmente distribuida con media p y varianza a 2 tal que 2 cr 0 = 30, que esta con 
<*!; = 225. 

Si antes de observar cualquier information pensamos que hay una alta probabilidad de que 
p este entre 2700 y 2900, podriamos escoger usar una previa normal conjugada para p con 
media 17 y varianza 8 2 escogidas de modo que 17 - 28 = 2700 y 77 + 28 = 2900 or) = 2800 y 
8 2 = 50 2 = 2500. Observe que hemos supuesto considerablemente mas conocimiento de las 
velocidades en la boca del canon que en el Ejemplo 8.11, donde solo supusimos que las ve¬ 
locidades en la boca del canon estaban normalmente distribuidas (con varianza desconocida). 
Si estamos mas comodos con esta estructura adicional, ahora tomamos nuestra muestra de 
tamano n = 8 y obtenemos las velocidades en la boca del canon dadas a continuation: 


3005 2925 2935 2965 
2995 3005 2937 2905 
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Solucion 


EJEMPLO 16.6 


Solucion 


Use la forma general para la densidad posterior para /a | u desarrollada en el Ejemplo 16.4 para 
dar un intervalo crefble de 95% para /a. 


Esta situation es un caso especial del que hablamos en el Ejemplo 16.4. En esta aplicacion de 
ese resultado general, 

n = 8, u = y t = 23 672, cr 2 = 225, 77 = 2800, S 2 = 2500. 

En el Ejemplo 16.4 determinamos que la densidad posterior de /jl \ u es una densidad normal 
con media rf y varianza S * 2 dadas por 

* = 8 2 u + a 2 r 1 = (2500) (23 672) + (225)(2800) = ^ ^ 

V n8 2 + 0-2 8(2500) +225 

5* 2 = ^ = (225)(2500) = 27 . 81 . 
nS 2 +o-2 8(2500)+225 

Finalmente, recuerde que cualquier variable aleatoria normalmente distribuida W con media 
Ijl w y varianza a/ v es tal que 

P(jjlw — 1.96 o-iv — W ^ i±w + 1.96 aw) = -95. 

Se deduce que un intervalo crefble de 95% para /jl es 


Ip* - 1.96<5*, 77 * + 1.965’) = (2957.23 - 1.96V27.81, 2957.23 + 1.96 V27.81) 

= (2946.89, 2967.57). ■ 


Es importante observar que diferentes personas que construyan intervalos crefbles para 
/jl, usando los datos del Ejemplo 16.5, obtendran otros intervalos si escogen distintos valores 
para cualquiera de los parametros 77 , 5 2 y a 2 . No obstante, para las opciones empleadas en el 
Ejemplo 16.5, al combinar su conocimiento previo con la informacion de los datos, el analista 
puede decir que la probabilidad posterior es .95 de que fi (aleatoria) esta en el intervalo (fijo) 
de (2946.89, 2967.57). 


En el Ejercicio 16.10 dijimos que si fj, Y 2 ,..., Y n denotan una muestra aleatoria de una pobla- 
cion exponencialmente distribuida con densidad / (y \ 0) = 0e Hly , 0 < y, y se utilizo la previa 
conjugada gamma (con parametros a y /3) para 6, entonces la densidad posterior para 0 es una 
densidad gamma con parametros cf = « + ayj3' = j3 /(/3 y,- + 1). Suponga que un ana¬ 

lista escogio a = 3 y (3 = 5 como valores de parametro apropiados para la previa y que una 
muestra de tamano « = 10 dio que ^ y, = 1.26. Construya intervalos crefbles de 90% para 6 
y la media de la poblacion, /jl = 1/6. 

En esta aplicacion del resultado general dado en el Ejercicio 16.10, 

n = 10, u = = 1-26, a = 3, 78 =5. 

La densidad posterior resultante de 6 es una densidad gamma con a* y [3 dadas por 

a* =n+a = 10 + 3 = 13, 

(3 5 

B* = - = - = .685. 

P PY.y, + I 5(1.26) + ! 
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Para completar nuestros calculos, necesitamos hallar dos valores ay b tales que 

P\a < 0 < b) = .90. 

Si lo hacemos asf, un intervalo crefble de 90% para 0 es (a, b). Ademas, como 

a < 9 < b si y solo si l/b < 1/0 <l/a, 

se deduce que un intervalo crefble de 90% para fi = 1/0 es (1 //;, 1 /a). 

Aun cuando no tenemos una tabla para obtener probabilidades asociadas con variables 
aleatorias de distribucion gamma con valores de parametro diferentes, estas probabilidades se 
pueden hallar usando una de las aplicaciones breves disponibles en www.thomsonedu.com/ 
statistics/wackerly. R, 5-Plus y otros programas de software de estadfstica se pueden usar tam¬ 
bien para calcular probabilidades asociadas con variables de distribucion gamma. Incluso asf, 
habra un numero infinite de opciones para ay b tales que P*(a < 0 < b) = .90. Si hallamos 
valores de a y b tales que 

P*(0 > a) = .95 y P*(0 > b) = .05, 

estos valores necesariamente satisfacen nuestro requisito inicial de que P*(a < 0 < b) = .90. 

En nuestra aplicacion presente determinamos que 0 tiene una posterior gamma con para- 
metros a* = 13 y f3* = .685. Usando la aplicacion Gamma Probabilities and Quantiles en el 
sitio web de Thomson, determinamos que 

P*(0 >5.2674) = .95 y P*(0 > 13.3182) = .05. 

Entonces, para los dates observados y la previa que seleccionamos, (5.2674, 13.3182) es un 
intervalo crefble de 90% para 0 mientras que [1/(13.3182), (1/5.7624)] = (.0751, .1898) es 
un intervalo crefble de 90% para p. = I/O. 

El comando qgamma (.05,13,1/.685) deR(o S-plus) tambien da el valor a = 5.2674 
dado lfneas antes, mientras que qgamma ( . 95,13,1/ . 685) da b = 13.3182. ■ 


Ejercicios 

16.13 Ejercicio Applet Active la aplicacion Binomial Revision y arrastre el cursor a la seccion marcada 

“Credible Interval”. Cambie el valor de la proportion de Bernoulli a 0.45 y los parametros de la previa 

beta aa = 3y/3 = 5y presione Enter en su computadora. 

a ^Cual es el intervalo crefble sin datos para p con base en la previa beta (3, 5)? 

b Use la aplicacion Beta Probabilities and Quantiles (accesible en www.thomsonedu.com/statistics/ 
wackerly) para calcular la probabilidad previa de que p es mayor que el punto extremo superior del 
intervalo que usted obtuvo en el inciso a. Tambien calcule la probabilidad de que p sea menor que el 
punto extremo inferior del intervalo que obtuvo en el inciso a. 

c Con base en sus respuestas al inciso b, ^cual es la probabilidad previa de que p este en el intervalo 
que obtuvo en el inciso a? ^,Esta usted de acuerdo en que el intervalo obtenido en el inciso a es un 
intervalo crefble de 95% para p con base en la previa beta (3, 5)? 

d Haga clic en el boton “Next Trial” una vez. ^La posterior basada en la muestra de tamano 1 es dife- 
rente a la previa? ^Como difiere la posterior de la previa? 
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e ^Cual es un intervalo crefble de 95% basado en la previa y el resultado de su muestra de tamano 1? 
^Es mayor o menor que el intervalo que obtuvo (sin datos) en el inciso a? 

f Haga clic en el boton “Next Trial” una vez mas. Compare la longitud de este intervalo (con base en 
los resultados de una muestra de tamano 2) con los intervalos obtenidos en los incisos aye. 

g Use la aplicacion Beta Probabilities and Quantiles para calcular la probabilidad posterior de que p 
sea mayor que el punto extremo superior del intervalo que obtuvo en el inciso f. ^E1 valor de esta 
probabilidad posterior le sorprende? 

h Haga clic en el boton “Next Trial” varias veces. Describa la forma en que la posterior cambia con 
datos adicionales. ^Que observa usted acerca de las longitudes de los intervalos crefbles obtenidos 
usando posteriores con base en tamanos muestrales mas grandes? 

16.14 Ejercicio Applet Consulte el Ejercicio 16.13. Seleccione un valor para el verdadero valor de la propor¬ 
tion p de Bernoulli y valores para los parametros de la previa beta conjugada. 

a Repita el Ejercicio 16.13 a-h, usando los valores que selecciono. 

b Haga clic tambien en el boton “50 Trials” unas pocas veces. Observe los valores de las sucesivas 
desviaciones estandar posteriores y las longitudes de los intervalos crefbles sucesivos. 

i (,Que observa acerca de las desviaciones estandar de las distribuciones posteriores sucesivas? 

ii Con base en su respuesta al inciso i, £que efecto espera observar acerca de las longitudes de 
intervalos crefbles sucesivos? 

iii (,Las longitudes de los intervalos crefbles sucesivos se comportaron como usted anticipo en el 
inciso ii? 

16.15 Ejercicio Applet En el Ejercicio 16.7 reconsideramos nuestro ejemplo de introduccion donde el nume- 
ro de quienes responden a un tratamiento para una enfermedad virulenta, en una muestra de tamano n, 
tuvo una distribucion binomial con parametro p y usamos una beta previa para p con parametros a = 1 y 
/3 — 3. Posteriormente hallamos que, al observar Y = y que respondieron, la funcion de densidad posterior 
para p \ y es una densidad beta con parametros a* = y+ a—y + 1 y f3* — n — y + f3 = n — y + 3. Si 
obtuvimos una muestra de tamano n = 25 que contenfa 4 personas que respondieron al nuevo tratamien¬ 
to, encuentre un intervalo crefble de 95% parap. [Utilice la aplicacion Beta Probabilities and Quantiles 
en www.thomsonedu.com/statistics/wackerly. Altemativamente, si W es una variable aleatoria de distri¬ 
bucion beta con parametros ay [3, el comando qbeta (p, a, (3) de R (o 5-Plus) da el valor w tal que 
P(W < w) = p.] 

16.16 Ejercicio Applet Repita las instrucciones para el Ejercicio 16.15 suponiendo una beta previa con para¬ 
metros a = 1 y /3 = 1 [una previa que es uniforme en el intervalo (0, 1)]. (Vea el resultado del Ejercicio 
16.8.) Compare este intervalo con el obtenido en el Ejercicio 16.15. 

16.17 Ejercicio Applet En el Ejercicio 16.9 empleamos una beta previa con parametros ay j3y hallamos la 
densidad posterior para el parametro p asociada con una distribucion geometrica. Determinamos que la 
distribucion posterior dep|y es beta con parametros a* = a+ ly/3* = /3 + y-l. Suponga que usamos a 
= 10 y /3 = 5 en nuestra beta previa y observamos el primer exito en el intento 6. Determine un intervalo 
crefble de 80% para p. 

16.18 Ejercicio Applet En el Ejercicio 16.10 hallamos la densidad posterior para 6 con base en una muestra 
de tamano n de una poblacion exponencialmente distribuida con media l/d. Especfficamente, usando 
la densidad gamma con parametros ay (3 como la previa para 0, hallamos que la densidad posterior 
para 6 | (y,, y 2 ,..., y„) es una densidad gamma con parametros a* = n+a y (3* = f3/{J3 ^ v, + l). 
Suponiendo que una muestra de tamano n = 15 produjo una muestra tal que ]Dyi = 30.27 y que 
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los parametros de la gamma previa son a — 2.3 y j3 = 0.4, use la aplicacion Gamma Probabilities and 
Quantiles para hallar intervalos crefbles de 80% para 6 y l/d, la media de la poblacion exponencial. 

16.19 Ejercicio Applet En el Ejercicio 16.11 encontramos la densidad posterior para A, la media de una 
poblacion con distribucion de Poisson. Suponiendo una muestra de tamano n y una gamma previa con- 
jugada ( a, /3) para A, demostramos que la densidad posterior de A [ Jj )’t es gamma con parametros 
a* = ^ y, + a y P* = yS/(n/3 + 1). Si una muestra de tamano n = 25 es tal que J]yj = 174 y los 
parametros previos fueron (a = 2, f5 = 3), use la aplicacion Gamma Probabilities and Quantiles para 
hallar un intervalo crefble de 95% para A. 

1 6.20 Ejercicio Applet En el Ejercicio 16.12 empleamos una gamma previa (a , /3) para v y una muestra de 
tamano n de una poblacion normal con media conocida y varianza 1/v para deducir la posterior para 
v. Especfficamente, si u — ^j(y, — ji 0 ) 2 , determinamos que la posterior de v\u es gamma con parame¬ 
tros a* = (m/2) + a y /3* = 2[il(uf3 + 2). Si escogemos que los parametros de la previa sean (a = 5, f5 
= 2) y una muestra de tamano n = 8 da el valor u = .8579, use la aplicacion Gamma Probabilities and 
Quantiles para determinar intervalos crefbles de 90% para v y 1/v, la varianza de la poblacion de la cual 
se obtuvo la muestra. 


16.4 Pruebas de hipotesis de Bayes 

Las pruebas de hipotesis tambien se pueden abordar desde una perspectiva de Bayes. Como 
hemos visto en secciones previas, el metodo de Bayes emplea informacion previa acerca de 
un parametro e informacion en los datos acerca de ese parametro para obtener la distribucion 
posterior. Si, como en la Seccion 10.11 en la que consideramos pruebas de razon de verosimi- 
litud, estamos interesados en probar que el parametro 0 se encuentra en uno de dos conjuntos 
de valores, O 0 y il rr podemos usar la distribucion posterior de 0 para calcular la probabilidad 
posterior de que 6 este en cada uno de estos conjuntos de valores. Cuando se pruebe H 0 : 0 
G Ql 0 contra H a : 0 G il ir un metodo que se usa con frecuencia es calcular las probabilidades 
posteriores P*(0 G 12 0 ) y P‘U) G il n ) y aceptar la hipotesis con la mas alta probabilidad poste¬ 
rior. Esto es, para probar H 0 : 0 G Ll 0 contra H a : 6 G il ir 

aceptar H a si P*(6 Gfto) >P*(9 Gl2„), 
aceptar PI a si P*(0 G Ql a ) > P*(0 Gflo). 


EJEMPLO 16.7 En el Ejemplo 16.5 obtuvimos un intervalo crefble de 95% para la velocidad media en la 
boca del canon asociada con granadas elaboradas con polvora reformulada. Supusimos que 
las velocidades asociadas en la boca del canon estan normalmente distribuidas con media /u 
y varianza cr; = 225 y que una densidad previa razonable para fi es normal con media 17 = 
2800 y varianza 8 2 = 2500. Entonces usamos los datos 

3005 2925 2935 2965 
2995 3005 2937 2905 


para obtener que la densidad posterior para /j. es normal con media 77 * = 2957.23 y desviacion 
estandar 8* = 5.274. Efectue la prueba de Bayes para 


H 0 : jj. < 2950 contra Pl a : jj. > 2950. 
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Solucion En este caso, si Z tiene una distribucion normal estandar, 

P\e g no) = 


y P*{9 G fl a ) = P*(fji > 2950) = 1 — P*(fJL 2950) = .9049. Entonces, vemos que la pro- 
babilidad posterior de H a es mucho mayor que la probabilidad posterior de H 0 y nuestra deci¬ 
sion es aceptar H a \ /jl> 2950. ■ 


P*{fi < 2950) 

, 2950 - rf 

P Z <---- 


= P Z < 


2950 - 2957.23 


5.274 


P(Z < -1.37) = .0951, 


De nuevo, observamos que si un analista diferente emplea los mismos datos para efectuar 
una prueba de Bayes para las mismas hipotesis pero con diferentes valores para cualquier 17 , 
S 2 y (Tg, obtendra probabilidades posteriores de las hipotesis que son diferentes a las obteni- 
das en el Ejemplo 16.7. Entonces, diferentes analistas con distintas opciones de valores para 
los parametros previos podrian llegar a conclusiones diferentes. 

En las situaciones mas frecuentes examinadas en los capitulos previos, el parametro 9 tiene 
un valor t'ijo pero desconocido y cualquier hipotesis es verdadera o falsa. Si 9 G fl 0 , entonces 
la hipotesis nula es ciertamente verdadera (con probabilidad 1 ), y la alternativa es ciertamente 
falsa. Si 9 G fl fl , entonces la hipotesis alternativa es ciertamente verdadera (con probabilidad 
1) y la hipotesis nula es ciertamente falsa. La linica forma en que podriamos saber si 0 G 11 0 
es si conocemos el verdadero valor de 0. Si este fuera el caso, efectuar una prueba de hipotesis 
serfa superfluo. Por esta razon, la prueba mas frecuente no hace referencia a las probabilida¬ 
des de las hipotesis sino que se concentra en la probabilidad de un error tipo I, a, y el poder 
de la prueba, poder (6) = 1 - /3 (9). Por el contrario, los conceptos mas frecuentes de tamano 
y poder no son de interes para un analista que utilice una prueba de Bayes. 


EJ EMPLO 16.8 En el Ejemplo 16.6 utilizamos un resultado dado en el Ejercicio 16.7 para obtener intervalos 
creibles para 0 y la media poblacional /i basada en Y v Y 2 ,..., Y n , una muestra aleatoria de una 
poblacion exponencialmente distribuida con densidad/(y \9) = 0e~ By , 0 < y. Usando una previa 
gamma conjugada por 9 con parametros a = 3 y j3 = 5 obtenemos que la densidad posterior 
para 9 es una densidad gamma con parametros a* = 13 y /3* = .685. Efectue una prueba de 
Bayes para 

H 0 : /jl > . 12 contra H a : ji < . 12. 

Solucion Como la media de la distribucion exponencial es /jl = 1/9, las hipotesis son equivalentes a 


// 0 : 9 < l/(. 12) = 8.333 contra H a : 9 > 8.333 


Como la densidad posterior para 9 es una densidad gamma con parametros a* = 13 y /3* = .685, 


P*(9 G fi 0 ) = P*(0 < 8.333) y P*(9 G f2 fl ) = P*(9 > 8.333). 
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En nuestra aplicacion presente, determinamos que 0 tiene una posterior gamma con parame- 
tros a* = 13 y /3* = .685. Usando la aplicacion Gamma Probabilities and Quantiles, 


y 


P*(0 G Q fl ) = P*(0 > 8.333) = 0.5570, 


P*(0 G fi 0 ) = P*(0 < 8.333) = 1 - P*{0 > 8.333) = 0.4430. 


En este caso, la probabilidad posterior de H a es un poco mayor que la probabilidad posterior 
de H 0 . Es decision del analista decidir si las probabilidades son suficientemente diferentes 
para ameritar la decision de aceptar H a \ pt < .12. 

Si usted prefiere usar R o .S'-PI us para calcular las probabilidades posteriores de las hipo- 
tesis, pganuna(8.333,13,1/.685) da P*(0 G O 0 ) = P*{0 < 8.333) y P*(0 G Q fl ) = 
P*(0 > 8.333) = 1 - P*(0 G O 0 ). ■ 


Ejercicios 

16.21 Ejercicio Applet En el Ejercicio 16.15 determinamos que la densidad posterior para p , la proporcion 
de quienes respondieron al nuevo tratamiento para una enfermedad virulenta, es una densidad beta con 
parametros a* = 5 y /3* = 24. ^Cual es la conclusion de una prueba de Bayes para H 0 : p < .3 contra 
H a \ p a .3? [Use la aplicacion Beta Probabilities and Quantiles en www.thomsonedu.com/statistics/ 
wackerly. Alternativamente, si W es una variable aleatoria con distribucion beta y parametros a y /3, el 
comando pbeta (w, a, /3) de R o S-Plus da P(W £ w).] 

16.22 Ejercicio Applet El Ejercicio 16.16 utilizo diferentes parametros previos pero los mismos datos para 
determinar que la densidad posterior para p, la proporcion de quienes respondieron al nuevo tratamiento 
para una enfermedad virulenta, es una densidad beta con parametros a* = 5 y /3* = 22. ^Cual es 
la conclusion de una prueba de Bayes para H 0 : p < . 3 contra H a \p S .3? Compare su conclusion con la 
obtenida en el Ejercicio 16.21. 

16.23 Ejercicio Applet En el Ejercicio 16.17 obtuvimos una posterior beta con parametros a* = 11 y j8* = 
10 para el parametro p asociado con una distribucion geometrica. ^Cual es la conclusion de una prueba 
de Bayes para H 0 : p < .4 contra H a \ p a .4? 

16.24 Ejercicio Applet En el Ejercicio 16.18 hallamos que la densidad posterior para 6 es una densidad gam¬ 
ma con parametros cr* = 17.3 y /3* = .0305. Dado que la media de la poblacion exponencial fundamental 
es /x = 1/6, probar las hipotesis H 0 : p < 2 contra H a : p, £: 2 es equivalente a probar H 0 : 6 > .5 contra 
H a : 6 £ .5. ^Cual es la conclusion de una prueba de Bayes para estas hipotesis? 

16.25 Ejercicio Applet En el Ejercicio 16.19 hallamos que la densidad posterior para A, la media de una 
poblacion con distribucion de Poisson, es una densidad gamma con parametros a* = 176 y f3* = .0395. 
^Cual es la conclusion de una prueba de Bayes para H 0 : A > 6 contra H a : A £ 6? 

16.26 Ejercicio Applet En el Ejercicio 16.20 determinamos que la posterior de v \ u es una densidad gamma 
con parametros a* = 9 y jS* = 1.0765. Recuerde que v = 1 /or 2 , donde cr 2 es la varianza de la poblacion 
fundamental que esta normalmente distribuida con media conocida p 0 . Probar las hipotesis H 0 \ cr 2 > 
0.1 contra H a : a 2 £ 0.1 es equivalente a probar H 0 .v< 10 contra H a : v a 10. ^,Cual es la conclusion 
de una prueba de Bayes para estas hipotesis? 
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16.5 Resumen y comentarios adicionales 

Como ya hemos visto en las secciones previas, la clave de los metodos inferenciales de Bayes 
(hallar estimadores, intervalos crefbles o realizar pruebas de hipotesis) es hallar la distribucion 
posterior del parametro 6. En especial cuando hay poca informacion, esta posterior depende 
en gran medida de la distribucion fundamental y previa de la poblacion de la cual se toma la 
muestra. Nos hemos enfocado en el uso de previas conjugadas debido a la sencillez resultante 
de hallar la distribucion posterior pedida del parametro de interes. Por supuesto que las previas 
conjugadas no son las unicas previas que se pueden usar, pero tienen la ventaja de resultar 
calculos faciles. Esto no significa que una previa conjugada sea necesariamente la election 
correcta para la previa. Incluso si seleccionamos correctamente la familia de la cual se tome 
la previa (hemos hecho repetido uso de previas beta y gamma), prevalece la dificultad de se- 
leccionar los valores apropiados asociados con los parametros de la previa. Hemos visto, sin 
embargo, que la option de los valores de parametro para la previa tiene impacto decreciente 
para tamanos muestrales mas grandes. 

Quiza sea apropiado hacer algunos comentarios acerca de la seleccion de valores de los 
parametros de la densidad previa. Si usamos una previa normal con media v y varianza 8 2 y 
pensamos que es probable (o improbable) que el parametro poblacional sea cercano a v, usa- 
rfamos un valor relativamente pequeno (grande) para 8 2 . Cuando se usa una previa beta con 
parametros ay (3 para un parametro que pensamos que tiene un valor cercano a c, podrfamos 
seleccionar a y [3 tales que la media de la previa, a/(a + [3), es igual a c y la varianza de la 
previa, af3/[(a + (3) 2 (a + f3 + 1)], es pequena. En el ejemplo de introduccion empleamos 
una previa beta con a = 1 y (3 = 3 porque pensamos que alrededor de 25% de quienes 
recibieron un nuevo tratamiento responderfan favorablemente. La media y la desviacion es- 
tandar de la posterior son, respectivamente, .25 y .1936. Observe que estas no son las unicas 
opciones para ay (3 que den .25 como la media de la previa. En general, si a/(a + (3) = c, 
entonces para cualquier k > 0 , a’ = kay f3' = k(3 tambien satisfacen a'/(a 1 + f3’) = c. No 
obstante, para una densidad beta con parametros a' = ka y /3' = kf3, la varianza de la previa 
es a'(3'[{a' + f3') 2 {a' + f3' + 1)] = a[3/[(a + (3) 2 (ka + kj3 + 1)]. Por tanto, si nuestra selec¬ 
cion inicial de a y [3 da un valor apropiado para la media de la previa pero preferimos una 
varianza mas pequena, podemos alcanzar esto al seleccionar alguna k> 1 y usar a' = kay 
/3' = k(3 como los parametros previos. Por el contrario, al seleccionar alguna k < I y usar 
a' = kay f3' = k(3 como parametros previos obtenemos la misma media previa pero varianza 
previa mas grande. Por tanto, resulta una previa mas vaga por seleccionar valores pequenos de 
a y (3 que sean tales que a/{a + (3) = c. la media previa deseada. 

Uno de los pasos al determinar la previa es definir la distribucion marginal de los datos. 
Para previas continuas, esto se logra al integrar la verosimilitud conjunta de los datos y el pa¬ 
rametro sobre la region de apoyo para la previa. En nuestro trabajo previo denotamos la masa 
marginal resultante o funcion de densidad para las variables aleatorias fj, Y 2 ,, Y n en una 
muestra de tamano n como m(y x , y 2 ,..., y„) o como m(u) si U es un estadfstico suficiente para 
6. Esta funcion marginal de densidad o masa se denomina funcion pronosticadora de masa o 
densidad de los datos. Hemos dado explfcitamente estas distribuciones pronosticadoras en todas 
nuestras aplicaciones. Esto se debe a que, parafraseando a Berger (1985, p. 95), el interes en la 
distribucion pronosticadora se centra en el hecho de que esta es la distribucion de acuerdo 
con la cual la informacion ocurre en realidad. Como se afirma en Box (1980, pp. 385-386), la 
evidencia potencial de una seleccion inapropiada de modelo es proporcionada por la distribucion 
pronosticadora de los datos, no por la distribucion posterior para el parametro. Algunos analistas 
expertos de Bayes escogen modelar la distribucion pronosticadora directamente y seleccionar 
la previa que lleve a la distribucion pronosticadora pedida. El reverendo Thomas Bayes (1784) 
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utilizo una previa uniforme (0, 1) para el parametro p de Bernoulli (o binomial) porque esta 
previa lleva a la distribucion pronosticadora que el penso era mas apropiada. Comentarios 
adicionales relevantes para la selection de algunos parametros previos se pueden hallar en la 
obra de Kepner y Wackerly (2002). 

Sin oponerse al parrafo anterior, es cierto que hay un atajo para hallar la densidad posterior 
de suma importancia para 9. Como ya se indico antes, si L (y ,, y 2 , ■ ■ ■, y n | 0) es la verosimilitud 
condicional de los datos y 9 tiene densidad previa continua g(0), entonces la densidad poste¬ 
rior de 9 es 


g*(0 \y\,yi,---, y n ) 


L(yi,y 2 ,..., y n \ 0) x g(0) 

>’ 2 , ■ ■ •, >’« | 9) x g(6) d9 


Observe que el denominador en el lado derecho de la expresion depende de y, , y 2 , ..., y n , pero 
no depende de 6. (Definir una integration con respecto a 9 produce un resultado que es libre 
de 9.) Al ver que con respecto a 9, el denominador es una constante, podemos escribir 


g*(0 | y u >’ 2 , ■ ■ ■, y n ) = c(yi, y 2 , ■. ■, y n )L(y i, y 2 ,..., y„ \ 9) X g(0), 


donde 


c{y i, y 2 ,..., y„) 


_ 1 _ 

fZo L (yuy 2 ,---, }’n | 0) Xg(0) d9 


no depende de 9. Ademas observe que, debido a que la densidad posterior es una funcion de 
densidad de buena fe, la cantidad c (y ], y 2 ,..., y„) debe ser tal que 



y„)d0 


= c(y u y 2 , 



L(yI,y 2 ,---, y n \0) Xg(6)d9 = 1. 


Finalmente, vemos que la densidad posterior es proportional al producto de la verosimilitud 
condicional de los datos y la densidad previa para 9: 


g*(0 | yi, y 2 ,. y„) OC L(y u y 2 ,..., y„\6) x g(0). 


donde la constante de proporcionalidad se escoge de modo que la integral de la funcion de 
densidad posterior sea 1. Ilustramos esto al reconsiderar el Ejemplo 16.1. 


EJ EMPLO 16.9 Denotemos con Y { , Y 2 , ..., Y n una muestra aleatoria de una distribucion de Bernoulli donde 
P(Y i = 1) = p y P(Y t = 0) = l~py supongamos que la distribucion previa para p es beta (a, 
f3). Encuentre la distribucion posterior para p. 
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Solucion A1 igual que antes, 


L(y i, yi,..., }’n | p)g(p) = 

yi,---, y„,p) oo 

De lo arriba expresado reconocemos que la resultante posterior para p debe ser beta con para- 

meiros a * =Y,yt+ay P*=n~Y / yi+ P- ■ 


p(yu yit • • ■ > jfi I p)g(p) 

^(i-^-E* [ r(g+ ^ 

Lr(a)r(/3) 

pY,yi +«- | (] - pY'-Hyi+P- 1 _ 


p a -\\-pf~ l 


(j Cual fue la ventaja de hallar la posterior previa usando este argumento de “proporcio- 
nalidad”? jConsiderablemente menos trabajo! i La desventaja? Nunca mostramos la funcion 
de masa pronosticadora para los datos y perdimos la oportunidad de criticar el modelo de 
Bayes. 

Las previas que no sean conjugadas bien podrfan ser mas apropiadas en aplicaciones es- 
pecificas. La posterior se encuentra usando el mismo procedimiento dado en la Seccion 16.2, 
pero podriamos obtener una distribution posterior con la cual no estemos familiarizados. 
Hallar la media de la posterior, intervalos creibles y las probabilidades de hipotesis relevantes 
podrfa ser mas problematico. Para los ejemplos de las secciones previas obtuvimos poste- 
riores que conociamos muy bien. Las medias posteriores fueron faciles de hallar porque ya 
habiamos determinado propiedades de variables aleatorias normales, con distribuciones beta y 
gamma. Ademas, se podia disponer facilmente de tablas para estas posteriores (en el apendice 
o de facil acceso con numerosos paquetes de software). Hay siempre un conjunto emergente 
de procedimientos de computadora en el que la posterior se determina con base en lo que 
introduzca el usuario acerca de la funcion de verosimilitud para los datos y la previa para el 
parametro. Una vez obtenida la posterior por medio del software, se usa exactamente como 
lo describimos antes. 

Los estimadores de Bayes se pueden evaluar por medio de criterios clasicos iterativos. Ya 
hemos visto que los estimadores de Bayes son sesgados. No obstante, suelen ser consistentes 
y, dependiendo de los criterios que se utilicen, pueden ser mejores que los estimadores itera¬ 
tivos correspondientes. En el Ejercicio 16.8, el lector determino que la MSE del estimador de 
Bayes era a veces menor que la MSE de estimation de verosimilitud maxima (MLE). Ademas, 
la influencia de la seleccion de los valores de parametro previos disminuye cuando el tamano 
de la muestra aumenta. 

En el Ejemplo 8.11 determinamos que el intervalo de confianza iterativo realizado para la 
media de una poblacion normalmente distribuida era (2926.3, 2991.7). Con el uso de la pers- 
pectiva iterativa, la verdadera media poblacional es fija pero desconocida. En consecuencia, 
este intervalo realizado captura el verdadero valor de pL o no lo captura. Dijimos que este era 
un intervalo de confianza de 95% porque el procedimiento (formula) empleado para produ- 
cirlo da intervalos que capturan la media fija alrededor de 95% del tiempo si muestras de 
tamano 8 se toman repetida e independientemente y se usan para construir muchos intervalos. 
Si se toman y usan 100 muestras de tamano 8 para producir intervalos de confianza realizados 
(diferentes), esperamos que aproximadamente 95 de ellos capturen el parametro. No sabemos 
cual de los 100 intervalos captura la media fija desconocida. La misma informacion se utilizo 
en el Ejemplo 16.5 para obtener (2946.89, 2967.57) como un intervalo creible de 95% para 
pi, ahora visto como una variable aleatoria. Desde la perspectiva de Bayes, tiene sentido 
expresar que la probabilidad posterior es .95 de que la media (aleatoria) se incluya en este 
intervalo (fijo). 
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La bondad de las pruebas clasicas de hipotesis se mide por a y (3, las probabilidades de 
errores tipo 1 y tipo II, respectivamente. Si pruebas con a = .05 se realizan en repetidas oca- 
siones (usando muestras diferentes, seleccionadas de manera independiente), entonces cuan- 
do H 0 es verdadera, es rechazada 5% del tiempo. Si H 0 es realmente verdadera y 100 muestras 
del mismo tamano se toman de manera independiente, esperamos rechazar la hipotesis nula 
(verdadera) unas cinco veces. No tiene sentido incluso tratar de calcular las probabilidades de 
las hipotesis. Desde la perspectiva de Bayes, el parametro de interes es una variable aleatoria 
con distribucion posterior deducida por el analista. El calculo de las probabilidades posterio- 
res para cada una de las hipotesis es completamente apropiado y es la base para la decision de 
una prueba de Bayes. 

(,CuaI es la mejor propuesta, la de Bayes o la iterativa? Es imposible dar una respuesta 
universal a esta pregunta. En algunas aplicaciones la propuesta de Bayes sera mejor; en otras 
la propuesta iterativa es mejor. 
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A1.1 Matrices y algebra de matrices 
A1.2 Suma de matrices 

A1.3 Multiplicacion de una matriz por un numero real 

A1.4 Multiplicacion de matrices 

A1.5 Elementos identidad 

A1.6 La inversa de una matriz 

A1.7 La transpuesta de una matriz 

A1.8 Una expresion matricial para un sistema de ecuaciones lineales simultaneas 
A1.9 Inversion de una matriz 

A1.10 Resolucion de un sistema de ecuaciones lineales simultaneas 
A1.11 Otros resultados matematicos utiles 


A1.1 Matrices y algebra de matrices 

La siguiente exposition representa un examen muy elemental y condensado de matrices y 
operaciones con matrices. Si usted busca una introduction mas completa del tema, consulte 
los libros citados en la bibliograffa indicada al final del Capitulo 11. 

Definiremos una matriz como un conjunto rectangular (arreglo) de numeros reales e indi- 
caremos matrices especificas simbolicamente con letras mayusculas negritas. Los numeros en 
la matriz, elementos, aparecen en posiciones especificas de renglon-columna, todas las cuales 
se llenan. El numero de renglones y columnas puede variar de una matriz a otra, de modo que 
en forma conveniente describimos el tamano de una matriz al dar sus dimensiones, es decir, el 
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numero de renglones y columnas. Asf, la matriz 


A = 

2X3 


6 

4 


A 

0 

2 


-1 

7 


posee dimensiones 2x3 porque contiene dos renglones y tres columnas. Del mismo 
modo, para 


B 

4X1 



y c 

2X2 


2 0 
-1 4 


las dimensiones de B y C son 4 x 1 y 2 x 2, respectivamente. Observe que la dimension de 
renglon siempre aparece primero y que las dimensiones se pueden escribir abajo del siinbolo 
identificador de la matriz como se indica para las matrices A, B y C. 

A1 igual que en algebra ordinaria, un elemento de una matriz puede estar indicado por un 
sfmbolo, a, b,..., y su position renglon-columna puede estar identificado por medio de un doble 
submdice. Asf, a 2l serfa el elemento del segundo renglon, primera columna. Los renglones se 
numeran en orden de arriba abajo y las columnas de izquierda a derecha. En la matriz A, a 2l 
= 4, a l3 = -1, y as! sucesivamente. 

Los elementos de un renglon particular estan identificados por el submdice de su co¬ 
lumna y, en consecuencia, estan numerados de izquierda a derecha. El primer elemento de un 
renglon esta a la izquierda. Analogamente, los elementos de una columna particular estan 
identificados por el submdice de su renglon y, por tanto, estan identificados del elemento su¬ 
perior de la columna al inferior. Por ejemplo, el primer elemento de la columna 2 de la matriz 
A es 0, el segundo es 2. Los elementos primero, segundo y tercero del renglon 1 son 6, 0 y 
-1, respectivamente. 

El termino algebra de matrices comprende, como su nombre lo indica, un algebra que se 
refiere a matrices, en forma muy semejante a como el algebra ordinaria se refiere a numeros 
o sfmbolos que representan numeros reales. Por tanto, expresaremos reglas para la suma y 
multiplication de matrices, asf definiremos otros elementos de un sistema algebraico. Al ha- 
cerlo, senalamos las similitudes o diferencias entre algebra de matrices y algebra ordinaria. 
Por ultimo, usaremos nuestras operaciones con matrices para expresar y resolver una ecuacion 
matricial muy sencilla. Esta, como es de esperarse, sera la solution que deseamos para las 
ecuaciones con mfnimos cuadrados. 


A1.2 Suma de matrices 

Dos matrices, por ejemplo A y B, se pueden sumar solo si son de las mismas dimensiones. 
La suma de dos matrices sera una matriz obtenida al sumar elementos correspondientes 
de las matrices A y B, es decir, elementos en posiciones correspondientes. Siendo este el 
caso, la suma resultante sera una matriz de las mismas dimensiones que A y B. 


EJEMPLO Al .1 Encuentre la suma indicada de las matrices A y B: 


A = 

2X3 


2 

1 

4' 


"0 

-1 

r 

-1 

6 

0 

B = 

2X3 

6 

-3 

2 













Solucion 
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A + B 


2 

1 

4' 

+ 

'0 

-1 

r 

-1 

6 

0 

6 

-3 

2 


‘ (2+0) (1-1) (4 + 1)' 


'2 0 5' 

(-1+6) (6-3) (0+2) 


5 3 2 


EJEMPLO A1.2 Encuentre la suma de las matrices 


Solucion 



'1 0 3' 


T 

<N 

A = 

1 -1 4 

y B = 

1 0 6 

3X3 

2-1 0 

3X3 

_ 3 1 4 


A + B 


5 2 2 

2 -1 10 

5 0 4 


Observe que (A + B) = (B + A), igual que en algebra ordinaria y recuerde que nunca su- 
mamos matrices de dimensiones diferentes. 


A1.3 Multiplication de una matriz por 
un numero real 


Deseamos una regia para multiplicar una matriz por un numero real, por ejemplo, 3A, donde 


A = 


2 

4 

-1 


1 

6 

0 


Ciertamente buscariamos que 3A fuera (A + A + A), para apegarnos a la regia de adicion. 
Por tanto, 3A significarfa que cada elemento de la matriz A debe multiplicarse por el mul- 
tiplicador 3, y 



3(2) 

3(1) 


6 

3" 

3A = 

3(4) 

3(6) 

= 

12 

18 


3(—1) 

3(0) 


-3 

0 


En general, dado un numero real c y una matriz A con elementos ay, el producto cA sera 
una matriz cuyos elementos son iguales a ca ;/ . 


A1.4 Multiplicacion de matrices 


La regia para multiplicacion de matrices requiere “multiplicacion de renglon-columna”, que 
definiremos mas adelante. El procedimiento puede parecer un poco complicado al novato pero 
no debe resultar demasiado diffcil despues de un poco de practica. Ilustramos con un ejemplo. 

























824 


Apendice 1 


Matrices y otros resultados matematicos utiles 


EJEMPLO A1.3 


Solucion 


Sean A y B 



0 

4 



2 

3 


Un elemento en el /-esimo renglon y /-esima columna del producto AB se obtiene al mul- 
tiplicar el /-esimo renglon de A por la /-esima columna de B. De este modo, el elemento del 
primer renglon, primera columna de AB se obtiene multiplicando el primer renglon de A por 
la primera columna de B. De igual manera, el elemento del primer renglon, segunda columna 
serfa el producto del primer renglon de A y la segunda columna de B. Observe que siempre 
usamos los renglones de A y las columnas de B, donde A es la matriz a la izquierda de B del 
producto AB. 

La multiplicacion renglon-columna es relativamente facil. Obtenga los productos, elemen¬ 
to del primer renglon por elemento de primera columna, elemento del segundo renglon por 
elemento de segunda columna, tercero por tercera y luego sume. Recuerde que los elementos 
de renglon y columna se marcan de izquierda a derecha y de arriba abajo, respectivamente. 

Si aplicamos estas reglas a nuestro ejemplo, obtenemos 


'2 O' 

" 5 

2' 



4 

1 4 

-1 

3 


1 

14 


El producto del primer renglon por la primera columna serfa (2)(5) + (0)(—1) = 10, que 
esta ubicado (y circulado) en el primer renglon, primera columna de AB. Del mismo modo, 
el elemento del primer renglon, segunda columna es igual al producto del primer renglon de 
A por la segunda columna de B, o (2)(2) + (0)(3) = 4. El producto del segundo renglon por 
la primera columna es (1)(5) + (4)(-l) = 1 y esta situado en el segundo renglon, primera co¬ 
lumna de AB. Por ultimo, el producto del segundo renglon por la segunda columna es (1)(2) 
+ (4)(3) = 14. 


Encuentre los productos AB y BA, donde 


y 


'2 

1 ' 





1 

-1 

y 

B = 

'4 

2 

-1 -1' 
0 2 

_0 

4 _ 







'2 r 


A B = 

i -i 


3X2 2X3 

i 

o 

_i 



-l 

o 



10 -2 0 
2 -1 -3 

8 0 8 


B A 

2X3 3X2 


'4 -1 

2 0 

-1" 

2 

2 

1 

1 

-1 

= 

'7 

4 

1 ' 
10 



0 

4 





Observe que en algebra matricial, a diferencia del algebra ordinaria, AB no es igual a BA. 
Debido a que A contiene tres renglones y B tres columnas, podemos formar (3)(3) = 9 combi- 
naciones renglon-columna por tanto nueve elementos para AB. En contraste, B contiene solo 
dos renglones, A dos columnas y por tanto el producto BA tendra solo (2)(2) = 4 elementos, 
correspondientes a las cuatro combinaciones diferentes renglon-columna. 

Ademas, observamos que la multiplicacion renglon-columna se basa en la suposicion 
de que los renglones de la matriz de la izquierda contienen el mismo numero de elemen- 
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tos que las columnas de la matriz a la derecha, de modo que elementos correspondientes 
existiran para la multiplicacion renglon-columna. ( ,Que hacemos cuando esta condicion 
no se satisface? Convenimos en no multiplicar dos matrices, por ejemplo AB, donde los 
renglones de A y las columnas de B contienen un numero desigual de elementos. 

Un examen de las dimensiones de las matrices dira si se pueden multiplicar asf como 
dar las dimensiones del producto. Escribiendo las dimensiones bajo las dos matrices, 

A B = AB 

mxp pxq mXq 

observamos que los dos numeros interiores, que dan el numero de elementos en un renglon de 
A y columna de B, respectivamente, deben ser iguales. Los dos numeros exteriores, que indi¬ 
can el numero de renglones de A y columnas de B, dan las dimensiones de la matriz producto. 
Se puede verificar la operacion de esta regia para el Ejemplo A1.3. 


EJEMPLO A1.4 Obtenga el producto AB: 


A B = [2 

1X3 3X2 


0 ] 


2 O' 
0 3 
-1 0 


= [4 3] 


Observe que el producto AB es (1 x 2) y que BA no esta definida por las respectivas dimen¬ 
siones de A y B. 


EJEMPLO A1.5 Encuentre el producto AB, donde 


Solucion 


A = [1 2 3 4] y B 


1 

2 

3 

4 


A B 

1X4 4X1 


[ 1234 ] 


1 

2 

3 

4 


[30], 


Observe que este ejemplo produce un metodo diferente para escribir una suma de cuadrados. ■ 


A1.5 Elementos identidad 

Los elementos identidad para adicion y multiplicacion en algebra ordinaria son 0 y 1, respec¬ 
tivamente. En adicion, 0 mas cualquier otro elemento, por ejemplo a , es igual a a; esto es, 


0 + 2 = 2 , 


0 + (-9) = -9. 
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EJEMPLO A1.6 


Analogamente, la multiplicacion del elemento identidad 1 por cualquier otro elemento, a 
por ejemplo, es igual a a; esto es, 

(1)(5)=5, (1)( 4) = —4. 

En algebra de matrices, se dice que dos matrices son iguales cuando todos los elemen- 
tos correspondientes son iguales. Con esto en mente definiremos las matrices de identi¬ 
dad de un modo semejante al empleado en algebra ordinaria. Por tanto, si A es cualquier 
matriz, una matriz B sera una matriz identidad para adicion si 

A + B = A y B + A = A. 

Con facilidad se puede ver que la matriz identidad para adicion es aquella en la que todo 
elemento es igual a cero. Esta matriz es de interes pero no tiene importancia practica en 
nuestro trabajo. 

Del mismo modo, si A es cualquier matriz, la matriz identidad para multiplicacion es una 
matriz I que satisface la relacion 


AI = A e IA = A. 

Esta matriz, llamada matriz identidad, es la matriz cuadrada 



- 1 

0 

0 

o • 

• ■ 0 


0 

1 

0 

0 ■ 

■ ■ 0 


0 

0 

1 

0 ■ 

■ • 0 

I = 

nxn 

0 

0 

0 

1 • 

■ • 0 


-0 

0 

0 

o ■ 

■ • 1 


Esto es, todos los elementos de la diagonal principal de la matriz, que corren de arriba a la 
izquierda a abajo a la derecha, son iguales a 1; todos los otros elementos son iguales a cero. 
Observe que la matriz identidad esta siempre indicada por el sfmbolo I. 

A diferencia del algebra ordinaria, que contiene solo un elemento identidad para mul¬ 
tiplicacion, el algebra de matrices debe contener un numero infinitamente grande de ma¬ 
trices identidad. Asf, debemos tener matrices con dimensiones lxl, 2x2, 3x3, 4x4, 
etcetera, para dar una identidad de las dimensiones correctas para permitir multiplicacion. 
Todo sera de esta forma. 

Que la matriz I satisfaga la relacion 


IA = AI = A 


se puede demostrar en un ejemplo. 


Sea 



1 0 
6 3 


Demuestre que IA = A y que AI = A. 
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Solucion 


A1.6 


DEFINICION A1.1 


y 


I A 

2X2 2X3 


'1 

o' 

2 

1 

O' 


2 

1 

O' 

0 

1 

-1 

6 

3 


-1 

6 

3 


A I = 

2X3 3X3 


2 1 0 
-16 3 


1 0 0 
0 1 0 
0 0 1 



1 0 
6 3 


= A. 


La inversa de una matriz 

Para que el algebra de matrices sea util, debemos ser capaces de construir y resolver ecuacio- 
nes de matrices para una matriz de incognitas en forma semejante a la empleada en algebra 
ordinaria. Esto, a su vez, requiere un metodo de efectuar una division. 

Por ejemplo, resolverfamos la ecuacion sencilla en algebra ordinaria, 

2x = 6 


al dividir entre 2 ambos lados de la ecuacion y obtener x = 3. Otra forma de ver esta opera- 
cion es para definir el reciproco de cada elemento, en un sistema algebraico y considerar 
la division como multiplicacion por el reciproco de un elemento. Podriamos resolver la 
ecuacion 2x = 6 al multiplicar ambos lados de la ecuacion por el reciproco de 2. En vista de 
que todo elemento del sistema de numeros reales posee un reciproco, con excepcion de 0, 
la operation de multiplicacion elimina la necesidad de la division. 

El reciproco de un numero c en algebra ordinaria es un numero b que satisface la relation 

cb = 1 


esto es, el producto de un numero por su reciproco debe ser igual al elemento identidad para 
multiplicacion. Por ejemplo, el reciproco de 2 es 1/2 y (2)(l/2) = 1. 

Un reciproco en algebra de matrices recibe el nombre de inverso de una matriz y se 
define como sigue: 


Sea A nxn una matriz cuadrada. Si se puede hallar una matriz A 1 tal que 

AA" 1 = 1 y A" 1 A = I 
entonces A -1 recibe el nombre de inversa de A. 


Observe que el requisite para una inversa en algebra de matrices es el mismo que en 
algebra ordinaria, es decir, el producto de A por su inversa debe ser igual a la matriz iden¬ 
tidad para multiplicacion. Ademas, la inversa no esta definida para matrices no cuadradas 
y, por tanto, numerosas matrices en algebra de matrices no tienen inversas (recuerde que 
0 era el unico elemento del sistema de numeros reales sin inversa). Por ultimo, expresamos 
sin prueba que muchas matrices cuadradas no tienen inversas; las que si tienen se identifi- 
caran en la Section A 1.9 y se dara un metodo para hallar la inversa de una matriz. 
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A1.7 La transpuesta de una matriz 

Hemos explicado la relacion que hay entre una matriz y su inversa. Una segunda relacion 
matricial util define la trcinspuesta de una matriz. 

DEFINICION A1.2 Sea A una matriz de dimensiones p x q. Entonces A', llamada la transpuesta de A, se 
define como la matriz obtenida al intercambiar renglones y columnas correspondientes 
de A; esto es, primera con primera, segunda con segunda, etcetera. 


Por ejemplo, sea 


Entonces 


" 2 O' 
A = 1 1 

3X2 4 3 


A' = 

2X3 


2 

0 


1 4 
1 3 


Observe que los renglones primero y segundo de A' son identicos a la primera y segunda 
columnas, respectivamente, de A. 

Como segundo ejemplo, sea 


Y = 


y i" 

n 

y-h 


Entonces Y' = |y y 2 y 3 ]. Como punto de interes, observamos que Y'Y = }f ■ 
Por ultimo, si 


A = 


2 14 ' 

0 2 3 
1 6 9 


entonces 


A' = 


2 0 
1 2 
4 3 


1 

6 

9 


A1.8 Una expresion matricial para un sistema de 
ecuaciones lineales simultaneas 


A continuacion presentamos una de las aplicaciones sencillas e importantes del algebra de 
matrices. Sea 

2vi + V 2 =5 

Vi - V 2 = 1 
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un par de ecuaciones lineales simultaneas con dos variables, v, y v 2 . Entonces definimos tres 
matrices: 



'2 

r 


Vi 


"5" 

A = 

1 


V = 

G = 

1 

2X2 

—2 

2X1 

v 2 

2X1 


Observe que A es la matriz de los coeficientes de las incognitas, cuando las ecuaciones se 
escriben cada una de ellas con las variables apareciendo en el mismo orden, leyendo de iz- 
quierda a derecha y con las constantes en el lado derecho del signo de igualdad. La matriz V 
proporciona las incognitas en una columna y en el mismo orden en que aparecen en las ecua¬ 
ciones. Por ultimo, la matriz G contiene las constantes en una columna exactamente como 
aparecen en el conjunto de ecuaciones. 

El sistema simultaneo de dos ecuaciones lineales puede ahora escribirse en notacion de 
matrices como 


AY = G 

este enunciado puede ser verificado facilmente al multiplicar A y Y y luego comparar la 
respuesta con G. 


AY 


2 

r 

V\ 


2vi + v 2 


"5" 

1 

-i 

v 2 _ 


< 

1 

< 

to 


1 


Observe que elementos correspondientes en AV y G son iguales, es decir, 2v, + v 2 = 5 y Vj - v 2 
= 1. Por tanto, AV = G. 

El metodo para escribir un par de ecuaciones lineales con dos incognitas como una ecua- 
cion de matrices se puede extender facilmente a un sistema de r ecuaciones con r incognitas. 
Por ejemplo, si las ecuaciones son 


aitvi +ai 2 v 2 +«i 3 v 3 H-+ a\ r v r = g\ 

a 2 \\’\ + a 22 v 2 + 023 V 3 + ' ' ■+a 2r v r = g 2 
« 3 iVi + o 32 v 2 + a 33 v 3 H-+ a 3r v r = g 3 


a r i Vi + a r2 v 2 + a r3 v 3 + ■ ■ • + a rr v r = g r 

defina 


a \i 

Ol2 

Ol3 • 

• Ol,- 


Vl 


g\ 

«21 

022 

023 ’ 

■ a 2r 


v 2 


gi 

«31 

032 

033 ' 

■ a 3r 

V = 

v 3 

G = 

gi 

0,1 

O r 2 

0,-3 • 

■ ■ a rr _ 


. v r . 


. gr . 


Observe que, una vez mas, A es una matriz cuadrada de coeficientes variables, mientras 
que V y G son matrices de columna que contienen las variables y constantes, respectivamente. 
Entonces AV = G. 

Cualquiera que sea el tamano del sistema de ecuaciones, si tenemos n ecuaciones lineales 
con n incognitas, el sistema se puede escribir como la ecuacion matricial simple AV = G. 

Usted observara que la matriz V contiene todas las incognitas, mientras que A y G son 
matrices constantes. 
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Apendice 1 


Matrices y otros resultados matematicos utiles 


Nuestro objetivo, por supuesto, es despejar la matriz de incognitas, V, donde la ecuacion 
AV = G es semejante a la ecuacion 

2v = 6 

en algebra ordinaria. Si esto es verdadero, no es de sorprenderse hallar que los metodos de 
soluciones son los mismos. En algebra ordinaria, ambos lados de la ecuacion se multiplican 
por el reclproco de 2; en algebra de matrices, ambos lados de la ecuacion se multiplican por 
A -1 . Entonces 


A -1 (AY) = A *G 


o bien, 


A~'AV = A 'G. 


Pero A 'A = I y ademas IY = Y. Por tanto, V = A ! G. En otras palabras, las soluciones al 
sistema de ecuaciones lineales simultaneas se pueden obtener al hallar A -1 y luego obtener 
el producto A 1 G. Los valores de solution de v v v 2 , v 3 ,..., v r apareceran en sucesion en la 
matriz de columna V = A G. 


A1.9 Inversion de una matriz 

Hemos indicado en la Seccion A 1.8 que la clave para las soluciones de un sistema de ecuacio¬ 
nes lineales simultaneas por el metodo de algebra de matrices se apoya en la adquisicion de 
la inversa de la matriz A. Existen numerosos metodos para invertir matrices. El metodo que 
presentamos no es el mejor desde un punto de vista computacional, pero funciona muy bien 
para las matrices asociadas con la mayor parte de disenos experimentales y es uno de los mas 
faciles de presentar al estudiante novato. Depende de un teorema en algebra de matrices y el 
uso de operaciones de renglon. 

Antes de definir operaciones de renglon en matrices, debemos expresar lo que se quiere de¬ 
ck por adicion de dos renglones de una matriz y la multiplicacion de un renglon por una cons- 
tante. Ilustraremos con la matriz A para el sistema de dos ecuaciones lineales simultaneas. 



Dos renglones de una matriz se pueden sumar si se suman sus elementos correspondientes. 
Asf, si los dos renglones de la matriz A se suman, se obtiene un nuevo renglon con elementos 
[(2 + 1)(1 - 1)] = [3 0]. La multiplicacion de un renglon por una constante significa que cada 
elemento del renglon se multiplica por la constante. Dos veces el primer renglon de la matriz 
A generarfa el renglon [4 2], Con estas ideas en mente, defmiremos tres formas de operar en 
un renglon de una matriz: 

1. Un renglon puede ser multiplicado por una constante. 

2. Un renglon puede ser multiplicado por una constante y sumado o restado de otro 
renglon (que esta identificado como aquel en el que se realiza la operation). 

3. Dos renglones pueden intercambiarse. 

Dada la matriz A, es muy facil ver que podrfamos efectuar una serie de operaciones de 
renglon que darfan la misma nueva matriz B. En este sentido expresamos sin demostracion 
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EJEMPLO A1.7 


Solucion 


un sorprendente e interesante teorema de algebra de matrices; es decir, existe alguna matriz C 
tal que 

CA = B 

En otras palabras, una serie de operaciones de renglon en una matriz A es equivalente a 
multiplicar A por una matriz C. Usaremos este principio para invertir una matriz. 

Coloque la matriz A, que ha de invertirse, junto a una matriz identidad de las mismas 
dimensiones: 


A = 


I 


A continuation realice las mismas operaciones de renglon en A e I en forma tal que A 
cambie a una matriz identidad. A1 hacerlo, debemos haber multiplicado A por una matriz C 
de modo que CA = I. Por tanto, jC debe ser la inversa de A! El problema, desde luego, es ha- 
llar la matriz desconocida C y, por fortuna, esto resulta ser de muy poca dificultad. Debido a 
que realizamos las mismas operaciones de renglon en A e I, la matriz identidad debe haber 
cambiado a Cl = C = A -1 . 


A = 


2 1 

1 -1 


I 


1 0 
0 1 


•l (mismas operaciones de renglon) 1 

CA = I Cl = C = A 1 

Ilustraremos con el siguiente ejemplo. 


Invierta la matriz 



Paso 1. Trabaje en el renglon 1 al multiplicar el renglon 1 por 1 /2. (Nota: Es util para el es- 
tudiante novato identificar el renglon en el que este operando porque todos los otros renglones 
seguiran sin cambio, aun cuando pueden usarse en la operacion. Pondremos un asterisco en el 
renglon sobre el cual la operacion se realice.) 


* 

'1 1/2' 


o 


1 -1 


0 1 


Paso 2. Trabaje en el renglon 2 al restar el renglon 1 del renglon 2. 



'1 1/2' 


1/2 O' 

* 

0 -3/2 


-1/2 1 


(Observe que el renglon 2 se usa simplemente para operar en el renglon 1 y por tanto 
permanece sin cambio.) 

Paso 3. Multiplique el renglon 2 por (-2/3). 


* 


To 


0 1 

i- 


1/2 

1/3 


0 

-2/3 
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Paso 4. Trabaje en el renglon 1 al multiplicar el renglon 2 por 1/2 y restar del renglon 1. 


* 

'1 o' 


'1/3 

1/3' 


0 1 


_ 1 /3 

-2/3 


(Observe que el renglon 2 se usa simplemente para operar en el renglon 1 y por tanto per- 
manece sin cambio.) En consecuencia, el inverso de A debe ser 


A-' = 


1/3 

1/3 


1/3 

-2/3 


Existe una verificacion facil de los calculos para el procedimiento de inversion porque 
A -1 A debe ser igual a la matriz identidad I. Entonces 


'1/3 

1/3' 

"2 r 


'1 o' 

_i/3 

-2/3 

i -i 


0 1 


EJEMPLO A1.8 Invierta la matriz 


y compruebe los resultados. 


A = 


2 0 

1 -1 

1 0 


1 

2 

0 


Solucion 



'2 

0 

1' 


'1 

0 

o' 

A = 

1 

-1 

2 

I = 

0 

1 

0 


1 

0 

0 


0 

0 

1 


Paso 1. Multiplique el renglon 1 por 1/2. 


* 

' 1 

0 

1/2' 


'1/2 

0 

o' 


1 

-1 

2 


0 

1 

0 


1 

0 

0_ 


_ 0 

0 

1_ 


Paso 2. Trabaje en el renglon 2 al restar el renglon 1 del renglon 2. 



1 

o 

1_ 


1 

o 

o 

1_ 

* 

0 -1 3/2 


-1/2 1 0 


O 

O 


o 

o 


Paso 3. Trabaje en el renglon 3 al restar el renglon 1 del renglon 3. 



1 

O 

To 


o 

o 

1_ 


0 -1 3/2 


-1/2 1 0 

* 

o 

o 


o 

T 


Paso 4. Trabaje en el renglon 2 al multiplicar el renglon 3 por 3 y sumar al renglon 2. 



1 

o 

To 


o 

o 

* 

0-1 0 


-2 1 3 


o 

o 

1 

To 


-1/2 0 1 
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Paso 5. Multiplique el renglon 2 por (-1). 



' 1 

0 

1/2 ' 


1/2 

0 

O' 

* 

0 

1 

0 


2 

-1 

-3 


_0 

0 

-1/2 . 


.-1/2 

0 

1 


Paso 6. Trabaje en el renglon 1 al sumar el renglon 3 al renglon 1. 


* 

'1 

0 

0 


0 

0 

1' 


0 

1 

0 


2 

-1 

-3 


0 

0 

-1/2. 


.-1/2 

0 

1 


Paso 7. Multiplique el renglon 3 por (-2). 



'1 

0 

0 ' 


'0 

0 

1' 


0 

1 

0 


2 

-1 

-3 

* 

0 

0 

1 


1 

0 

-2 


Las siete operaciones de renglon han cambiado la matriz A a la matriz identidad y, ex- 
cluyendo errores de calculo, han cambiado la identidad a A -1 . 

Al comprobar, tenemos 


O 

O 


'2 o r 


o 

o 

2 -1 -3 


1 -1 2 

= 

0 1 0 

1 

<N 

1 

O 

_ 1 


1 

o 

o 

i 


i 

o 

o 
_1 


Vemos que A * 1 A = I y por tanto que los calculos son correctos. 


Observese que la sucesion de operaciones de renglon requeridas para convertir A en 

I no es unica. Una persona podria obtener la inversa si usa cinco operaciones de renglon, 
mientras que otra podria necesitar diez, pero el resultado final sera el mismo. No obstante, 
para mayor eficiencia es deseable emplear un sistema. 

Observe que el proceso de inversion utiliza operaciones de renglon para cambiar elementos 
fuera de la diagonal de la matriz A a numeros 0 y los elementos de la diagonal principal a nu- 
meros 1. Un procedimiento sistematico es el siguiente. Cambie a 1 el elemento de arriba a la 
izquierda y luego realice operaciones de renglon para cambiar a 0 todos los otros elementos de 
la primera columna. A continuacion pase al elemento diagonal del segundo renglon, segunda 
columna, cambielo a un 1, y cambie a 0 todos los elementos de la segunda columna debajo de 
la diagonal principal. Este proceso se repite, al moverse hacia la parte inferior de la diagonal 
principal de arriba a la izquierda a abajo a la derecha, hasta que todos los elementos debajo de 
la diagonal principal hayan cambiado a 0. Para eliminar elementos diferentes de cero arriba 
de la diagonal principal, trabaje en todos los elementos de la ultima columna, cambiando cada 
uno de ellos a 0; entonces pase al siguiente a la ultima columna y repita el proceso. Continue 
este procedimiento hasta que llegue al primer elemento de la primera columna, que fue el 
punto de partida. Este procedimiento esta indicado en forma diagramatica en la Figura Al.l. 

La inversion de matrices es un proceso tedioso, en el mejor de los casos, y requiere tan¬ 
to trabajo como las soluciones de un sistema de ecuaciones simultaneas por eliminacion 
o sustitucion. Al lector le agradara saber que no esperamos que desarrolle facilidad para 
inversion de matrices. Por fortuna, casi todas las matrices asociadas con experimentos di- 
senados siguen patrones y se invierten facilmente. 
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Sera benefico que el lector invierta unas cuantas matrices de2x2yde3x3. Las matrices 
que carecen de un modelo, en particular las matrices grandes, se invierten de manera mas 
eficiente y economica en computadora. (Se han perfeccionado programas para inversion de 
matrices para casi todas las computadoras.) 

Destacamos el hecho de que obtener las soluciones para las ecuaciones de mmimos 
cuadrados (Capitulo 11) por inversion de matrices tiene ventajas distintivas que pueden 
o no ser evidentes. En especial esta el hecho de que el procedimiento de inversion es 
sistematico y, por tanto, es particularmente apropiado para calculo en computadora. No 
obstante, la principal ventaja es que el procedimiento de inversion de manera automatica 
producira las varianzas de los estimadores de todos los parametros del modelo lineal. 

Antes de salir del tema de inversion de matrices, preguntamos como se puede iden- 
tificar una matriz que tenga una inversa. Una consulta a una explication de ecuaciones 
lineales de algebra ordinaria debe dar la respuesta. 

Evidentemente, una solucion unica para un sistema de ecuaciones lineales simultaneas 
no puede obtenerse a menos que las ecuaciones sean independientes. Entonces, si una de 
las ecuaciones es una combinacion lineal de las otras, las ecuaciones son dependientes. 
Las matrices de coeficientes asociadas con sistemas dependientes de ecuaciones lineales 
no poseen una inversa. 


A1.10 Resolucion de un sistema de ecuaciones 
lineales simultaneas 

Finalmente hemos obtenido todos los ingredientes necesarios para resolver un sistema de 
ecuaciones lineales simultaneas, 

2vi + V 2 =5 
Vi - v 2 = 1 
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Si recordamos que las soluciones matriciales al sistema de ecuaciones AV = G es Y = A *G, 
obtenemos 


V = A J G = 


'1/3 

1/3' 

"5" 


"2" 

_!/3 

-2/3 

1 


1 


Por tanto, la solucion es 



esto es, Vj = 2 y v 2 = 1, lo cual se puede verificar por sustitucion de estos valores en las 
ecuaciones lineales originales. 


EJEMPLO Al.9 Resuelva el sistema de ecuaciones lineales simultaneas 


2vi V 3 — 4 
v’i — v’2 + 2V3 = 2 


V! = 1. 


Solucion La matriz coeficiente para estas ecuaciones, 


A = 


2 

1 

1 


0 

-1 

0 


1 

2 

0 


aparecio en el Ejemplo A1.8. En ese ejemplo, encontramos que 


A 1 


0 0 

2 -1 

1 0 



Resolviendo, tenemos 


V = A ‘G = 


0 0 1 
2 -1 -3 

1 0 -2 


'4' 


' r 

2 

= 

3 

1 


2 


Entonces, v x = 1, v 2 = 3 y v 3 = 2 da las soluciones al conjunto de tres ecuaciones lineales 
simultaneas. 


A1.11 Otros resultados matematicos utiles 


El proposito de esta seccion es hacer que usted cuente con una referenda conveniente para al- 
gunos de los resultados matematicos clave que se usan con frecuencia en el cuerpo del texto. 
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La expansion binomial de (x + y)" Sean x e y cualesquier numeros reales, entonces 


(x +y) n = QxV + (”)x" V + Q)x" 2 y 2 +■ ■ •+ (”)xV 

- so *- 


•-■y. 


1=0 


La Mima de M/ifl geometrica Sea r un numero real tal que Irl < 1, y m sea cualquier 
entero m>\ 

°o i oo „ m i _ m+1 

Vr' = —, yv = —, w = —. 

La expansion de la serie (de Taylor) de e x Sea x cualquier numero real, entonces 


E x 

Ji' 

i= 0 ’ 


A continuation tenemos algunas formulas utiles para sumas particulares. Las pruebas 
(omitidas) se establecen con mas facilidad con el uso de induccion matematica. 

n(n + 1) 


Funcion gamma Sea t > 0, entonces r(r) esta definida por la integral siguiente: 

pOO 

r(0 = / y^e-Uy. 

J o 

Usando la tecnica de integracion por partes, se deduce que para cualquier t > 0 



r(t + i) = tr(t) 

y si t = n, donde n es un entero, 

r(n) =(n~ 1)!. 


Ademas, 

T(l/2 ) =\/7 T. 

Si a,/3 > 0, la funcion beta, B(a , (3 ), esta definida por la siguiente integral, 


B(a,P) = 


f y a -\l-yf- l dy 

Jo 


y esta relacionada a la funcion gamma como sigue: 

r(a)np) 


B(a,p ) = 


r (a+13) 







APENDICE 2 


Distribuciones, medias, 
varianzas y funciones 
generadoras de momenta 
de probabilidad comun 


Tabla 1 Distribuciones discretas 


Distribucion 


Funcion de probabilidad Media 


Varianza 


Binomial 


Geometrica 


Hipergeometrica 


Poisson 


P(y) = (;)p y ( 1 -p)"- y \ 

y = 0, 1,..., n 

p(y) = p(X ~ p) y ~'\ 
y = i,2,... 


p(y) = 


y = 0, 1,..., n sin 
y = 0, 1,..., r sin > r 


p(y) = 


A- V e~ 




y =0, 1,2,... 


rcp 

1 

P 


Binomial negativa p(y) = (J’ j) p r { 1 — p) 3 " r ; 

y = r, r + 1,... 


r 

P 


np(l - p) 


1 -p 


(y) (»-y). nr /r\/N~r\/N~n 

(Yj ’ iv "viv/y iv /VAf-i 


r(l - p) 


Funcion 
generadora 
de momento 


[pe< +(1 ~p)]" 

P e< 

1-0 -p)e< 

No existe en 
forma cerrada 

exp[A(e' — 1)] 

pe‘ T 
_ 1 — (1 -p)e'_ 
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838 Apendice 2 Distribuciones, medias, varianzas y funciones generadoras de momenta de probabilidad comun 


Tabla 2 Distribuciones continuas 


Distribution 


Funcion de probabilidad 


Uniforme f(y) = 1 :0, < y < 0 2 

02 o\ 


l 

Normal f(y) — —^=exp 


-(±- 


aV2^ L \2^ 2 

— OO < y < + 00 


O' -m) 


Exponencial 


f{y) = ^ e ~ y/p - P > o 

0 < y < oo 


Gamma 


/ O) = 


1 


y a ~ l e~ y ^\ 


r (a)/3 a _ ' 

0 < y < oo 


Ji-cuadrada 


/O) = 


(;y)("/2)-l e —>/2 

2"l 2 T(v/2) ’ 
y >0 


Beta 


/O) = 


r(« +/3) 


Lr(a)r(^)j 

0 <y < 1 


y“ _1 (l -y)^ 1 ; 


Media 

Varianza 

Funcion 
generadora 
de momento 

0 \ + 62 

(02 ~ 0i ) 2 

e <th - e 'Si 

2 

12 

002 - 01) 


rr 2 

/ Oo- 2 

expl p,/ + — 


P 

P 1 

a-pty' 

ce/3 

a/3 2 

a -pty a 


v 


2v (1 — 2 t )~ v ! 2 


a afi 

a + fi (a + /3) 2 (ct + ft + 1 ) 


no existe en 
forma cerrada 






















APENDICE 3 


Tab I as 


Tabla 1 Probabilidades binomiales 

a 

Los valores tabulados son P(Y < a) = ^ P(y)- (Los calculos estan redondeados al tercer lugar decimal.) 
(a) n = 5 y=° 


P 


a 

0.01 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0.99 

a 

0 

.951 

.774 

.590 

.328 

.168 

.078 

.031 

.010 

.002 

.000 

.000 

.000 

.000 

0 

1 

.999 

.977 

.919 

.737 

.528 

.337 

.188 

.087 

.031 

.007 

.000 

.000 

.000 

1 

2 

1.000 

.999 

.991 

.942 

.837 

.683 

.500 

.317 

.163 

.058 

.009 

.001 

.000 

2 

3 

1.000 

1.000 

1.000 

.993 

.969 

.913 

.812 

.663 

.472 

.263 

.081 

.023 

.001 

3 

4 

1.000 

1.000 

1.000 

1.000 

.998 

.990 

.969 

.922 

.832 

.672 

.410 

.226 

.049 

4 

(b) n 

= 10 





















P 








a 

0.01 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0.99 

a 

0 

.904 

.599 

.349 

.107 

.028 

.006 

.001 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.996 

.914 

.736 

.376 

.149 

.046 

.011 

.002 

.000 

.000 

.000 

.000 

.000 

1 

2 

1.000 

.988 

.930 

.678 

.383 

.167 

.055 

.012 

.002 

.000 

.000 

.000 

.000 

2 

3 

1.000 

.999 

.987 

.879 

.650 

.382 

.172 

.055 

.011 

.001 

.000 

.000 

.000 

3 

4 

1.000 

1.000 

.998 

.967 

.850 

.633 

.377 

.166 

.047 

.006 

.000 

.000 

.000 

4 

5 

1.000 

1.000 

1.000 

.994 

.953 

.834 

.623 

.367 

.150 

.033 

.002 

.000 

.000 

5 

6 

1.000 

1.000 

1.000 

.999 

.989 

.945 

.828 

.618 

.350 

.121 

.013 

.001 

.000 

6 

7 

1.000 

1.000 

1.000 

1.000 

.998 

.988 

.945 

.833 

.617 

.322 

.070 

.012 

.000 

7 

8 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.989 

.954 

.851 

.624 

.264 

.086 

.004 

8 

9 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.994 

.972 

.893 

.651 

.401 

.096 

9 


839 
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Tabla 1 ( continue ) 

(c) n = 15 

P 


a 

0.01 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0.99 

a 

0 

.860 

.463 

.206 

.035 

.005 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.990 

.829 

.549 

.167 

.035 

.005 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

1 

2 

1.000 

.964 

.816 

.398 

.127 

.027 

.004 

.000 

.000 

.000 

.000 

.000 

.000 

2 

3 

1.000 

.995 

.944 

.648 

.297 

.091 

.018 

.002 

.000 

.000 

.000 

.000 

.000 

3 

4 

1.000 

.999 

.987 

.836 

.515 

.217 

.059 

.009 

.001 

.000 

.000 

.000 

.000 

4 

5 

1.000 

1.000 

.998 

.939 

.722 

.403 

.151 

.034 

.004 

.000 

.000 

.000 

.000 

5 

6 

1.000 

1.000 

1.000 

.982 

.869 

.610 

.304 

.095 

.015 

.001 

.000 

.000 

.000 

6 

7 

1.000 

1.000 

1.000 

.996 

.950 

.787 

.500 

.213 

.050 

.004 

.000 

.000 

.000 

7 

8 

1.000 

1.000 

1.000 

.999 

.985 

.905 

.696 

.390 

.131 

.018 

.000 

.000 

.000 

8 

9 

1.000 

1.000 

1.000 

1.000 

.996 

.966 

.849 

.597 

.278 

.061 

.002 

.000 

.000 

9 

10 

1.000 

1.000 

1.000 

1.000 

.999 

.991 

.941 

.783 

.485 

.164 

.013 

.001 

.000 

10 

11 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.982 

.909 

.703 

.352 

.056 

.005 

.000 

11 

12 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.996 

.973 

.873 

.602 

.184 

.036 

.000 

12 

13 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.995 

.965 

.833 

.451 

.171 

.010 

13 

14 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.995 

.965 

.794 

.537 

.140 

14 

(d) n 

= 20 





















P 








a 

0.01 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0.99 

a 

0 

.818 

.358 

.122 

.012 

.001 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.983 

.736 

.392 

.069 

.008 

.001 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

1 

2 

.999 

.925 

.677 

.206 

.035 

.004 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

2 

3 

1.000 

.984 

.867 

.411 

.107 

.016 

.001 

.000 

.000 

.000 

.000 

.000 

.000 

3 

4 

1.000 

.997 

.957 

.630 

.238 

.051 

.006 

.000 

.000 

.000 

.000 

.000 

.000 

4 

5 

1.000 

1.000 

.989 

.804 

.416 

.126 

.021 

.002 

.000 

.000 

.000 

.000 

.000 

5 

6 

1.000 

1.000 

.998 

.913 

.608 

.250 

.058 

.006 

.000 

.000 

.000 

.000 

.000 

6 

7 

1.000 

1.000 

1.000 

.968 

.772 

.416 

.132 

.021 

.001 

.000 

.000 

.000 

.000 

7 

8 

1.000 

1.000 

1.000 

.990 

.887 

.596 

.252 

.057 

.005 

.000 

.000 

.000 

.000 

8 

9 

1.000 

1.000 

1.000 

.997 

.952 

.755 

.412 

.128 

.017 

.001 

.000 

.000 

.000 

9 

10 

1.000 

1.000 

1.000 

.999 

.983 

.872 

.588 

.245 

.048 

.003 

.000 

.000 

.000 

10 

11 

1.000 

1.000 

1.000 

1.000 

.995 

.943 

.748 

.404 

.113 

.010 

.000 

.000 

.000 

11 

12 

1.000 

1.000 

1.000 

1.000 

.999 

.979 

.868 

.584 

.228 

.032 

.000 

.000 

.000 

12 

13 

1.000 

1.000 

1.000 

1.000 

1.000 

.994 

.942 

.750 

.392 

.087 

.002 

.000 

.000 

13 

14 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.979 

.874 

.584 

.196 

.011 

.000 

.000 

14 

15 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.994 

.949 

.762 

.370 

.043 

.003 

.000 

15 

16 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.984 

.893 

.589 

.133 

.016 

.000 

16 

17 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.996 

.965 

.794 

.323 

.075 

.001 

17 

18 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.992 

.931 

.608 

.264 

.017 

18 

19 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.988 

.878 

.642 

.182 

19 










Tablas 841 


Tabla 1 (continua) 

(e) n =25 

P 


a 

0.01 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0.99 

a 

0 

.778 

.277 

.072 

.004 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.974 

.642 

.271 

.027 

.002 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

1 

2 

.998 

.873 

.537 

.098 

.009 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

2 

3 

1.000 

.966 

.764 

.234 

.033 

.002 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

3 

4 

1.000 

.993 

.902 

.421 

.090 

.009 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

4 

5 

1.000 

.999 

.967 

.617 

.193 

.029 

.002 

.000 

.000 

.000 

.000 

.000 

.000 

5 

6 

1.000 

1.000 

.991 

.780 

.341 

.074 

.007 

.000 

.000 

.000 

.000 

.000 

.000 

6 

7 

1.000 

1.000 

.998 

.891 

.512 

.154 

.022 

.001 

.000 

.000 

.000 

.000 

.000 

7 

8 

1.000 

1.000 

1.000 

.953 

.677 

.274 

.054 

.004 

.000 

.000 

.000 

.000 

.000 

8 

9 

1.000 

1.000 

1.000 

.983 

.811 

.425 

.115 

.013 

.000 

.000 

.000 

.000 

.000 

9 

10 

1.000 

1.000 

1.000 

.994 

.902 

.586 

.212 

.034 

.002 

.000 

.000 

.000 

.000 

10 

11 

1.000 

1.000 

1.000 

.998 

.956 

.732 

.345 

.078 

.006 

.000 

.000 

.000 

.000 

11 

12 

1.000 

1.000 

1.000 

1.000 

.983 

.846 

.500 

.154 

.017 

.000 

.000 

.000 

.000 

12 

13 

1.000 

1.000 

1.000 

1.000 

.994 

.922 

.655 

.268 

.044 

.002 

.000 

.000 

.000 

13 

14 

1.000 

1.000 

1.000 

1.000 

.998 

.966 

.788 

.414 

.098 

.006 

.000 

.000 

.000 

14 

15 

1.000 

1.000 

1.000 

1.000 

1.000 

.987 

.885 

.575 

.189 

.017 

.000 

.000 

.000 

15 

16 

1.000 

1.000 

1.000 

1.000 

1.000 

.996 

.946 

.726 

.323 

.047 

.000 

.000 

.000 

16 

17 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.978 

.846 

.488 

.109 

.002 

.000 

.000 

17 

18 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.993 

.926 

.659 

.220 

.009 

.000 

.000 

18 

19 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.971 

.807 

.383 

.033 

.001 

.000 

19 

20 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.991 

.910 

.579 

.098 

.007 

.000 

20 

21 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.967 

.766 

.236 

.034 

.000 

21 

22 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.991 

.902 

.463 

.127 

.002 

22 

23 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.973 

.729 

.358 

.026 

23 

24 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.996 

.928 

.723 

.222 

24 
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Tabla 2 Tabla de e * 


X 

e“ x 

X 

e“ x 

X 


X 

e~ x 

0.00 

1.000000 

2.60 

.074274 

5.10 

.006097 

7.60 

.000501 

0.10 

.904837 

2.IQ 

.067206 

5.20 

.005517 

7.70 

.000453 

0.20 

.818731 

2.80 

.060810 

5.30 

.004992 

7.80 

.000410 

0.30 

.740818 

2.90 

.055023 

5.40 

.004517 

7.90 

.000371 

0.40 

.670320 

3.00 

.049787 

5.50 

.004087 

8.00 

.000336 

0.50 

.606531 

3.10 

.045049 

5.60 

.003698 

8.10 

.000304 

0.60 

.548812 

3.20 

.040762 

5.70 

.003346 

8.20 

.000275 

0.70 

.496585 

3.30 

.036883 

5.80 

.003028 

8.30 

.000249 

0.80 

.449329 

3.40 

.033373 

5.90 

.002739 

8.40 

.000225 

0.90 

.406570 

3.50 

.030197 

6.00 

.002479 

8.50 

.000204 

1.00 

.367879 

3.60 

.027324 

6.10 

.002243 

8.60 

.000184 

1.10 

.332871 

3.70 

.024724 

6.20 

.002029 

8.70 

.000167 

1.20 

.301194 

3.80 

.022371 

6.30 

.001836 

8.80 

.000151 

1.30 

.272532 

3.90 

.020242 

6.40 

.001661 

8.90 

.000136 

1.40 

.246597 

4.00 

.018316 

6.50 

.001503 

9.00 

.000123 

1.50 

.223130 

4.10 

.016573 

6.60 

.001360 

9.10 

.000112 

1.60 

.201897 

4.20 

.014996 

6.70 

.001231 

9.20 

.000101 

1.70 

.182684 

4.30 

.013569 

6.80 

.001114 

9.30 

.000091 

1.80 

.165299 

4.40 

.012277 

6.90 

.001008 

9.40 

.000083 

1.90 

.149569 

4.50 

.011109 

7.00 

.000912 

9.50 

.000075 

2.00 

.135335 

4.60 

.010052 

7.10 

.000825 

9.60 

.000068 

2.10 

.122456 

4.70 

.009095 

7.20 

.000747 

9.70 

.000061 

2.20 

.110803 

4.80 

.008230 

7.30 

.000676 

9.80 

.000056 

2.30 

.100259 

4.90 

.007447 

7.40 

.000611 

9.90 

.000050 

2.40 

.090718 

5.00 

.006738 

7.50 

.000553 

10.00 

.000045 

2.50 

.082085 











Tablas 843 


Tabla 3 Probabilidades de Poisson 


\a 

A\ 

0 

1 

2 

3 

4 

5 

6 

7 

8 9 

0.02 

0.980 

1.000 








0.04 

0.961 

0.999 

1.000 







0.06 

0.942 

0.998 

1.000 







0.08 

0.923 

0.997 

1.000 







0.10 

0.905 

0.995 

1.000 







0.15 

0.861 

0.990 

0.999 

1.000 






0.20 

0.819 

0.982 

0.999 

1.000 






0.25 

0.779 

0.974 

0.998 

1.000 






0.30 

0.741 

0.963 

0.996 

1.000 






0.35 

0.705 

0.951 

0.994 

1.000 






0.40 

0.670 

0.938 

0.992 

0.999 

1.000 





0.45 

0.638 

0.925 

0.989 

0.999 

1.000 





0.50 

0.607 

0.910 

0.986 

0.998 

1.000 





0.55 

0.577 

0.894 

0.982 

0.988 

1.000 





0.60 

0.549 

0.878 

0.977 

0.997 

1.000 





0.65 

0.522 

0.861 

0.972 

0.996 

0.999 

1.000 




0.70 

0.497 

0.844 

0.966 

0.994 

0.999 

1.000 




0.75 

0.472 

0.827 

0.959 

0.993 

0.999 

1.000 




0.80 

0.449 

0.809 

0.953 

0.991 

0.999 

1.000 




0.85 

0.427 

0.791 

0.945 

0.989 

0.998 

1.000 




0.90 

0.407 

0.772 

0.937 

0.987 

0.998 

1.000 




0.95 

0.387 

0.754 

0.929 

0.981 

0.997 

1.000 




1.00 

0.368 

0.736 

0.920 

0.981 

0.996 

0.999 

1.000 



1.1 

0.333 

0.699 

0.900 

0.974 

0.995 

0.999 

1.000 



1.2 

0.301 

0.663 

0.879 

0.966 

0.992 

0.998 

1.000 



1.3 

0.273 

0.627 

0.857 

0.957 

0.989 

0.998 

1.000 



1.4 

0.247 

0.592 

0.833 

0.946 

0.986 

0.997 

0.999 

1.000 


1.5 

0.223 

0.558 

0.809 

0.934 

0.981 

0.996 

0.999 

1.000 


1.6 

0.202 

0.525 

0.783 

0.921 

0.976 

0.994 

0.999 

1.000 


1.7 

0.183 

0.493 

0.757 

0.907 

0.970 

0.992 

0.998 

1.000 


1.8 

0.165 

0.463 

0.731 

0.891 

0.964 

0.990 

0.997 

0.999 

1.000 

1.9 

0.150 

0.434 

0.704 

0.875 

0.956 

0.987 

0.997 

0.999 

1.000 

2.0 

0.135 

0.406 

0.677 

0.857 

0.947 

0.983 

0.995 

0.999 

1.000 
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Apendice 3 


Tablas 


Tab I a 3 (continua) 


\a 

K 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

2.2 

0.111 

0.355 

0.623 

0.819 

0.928 

0.975 

0.993 

0.998 

1.000 


2.4 

0.091 

0.308 

0.570 

0.779 

0.904 

0.964 

0.988 

0.997 

0.999 

1.000 

2.6 

0.074 

0.267 

0.518 

0.736 

0.877 

0.951 

0.983 

0.995 

0.999 

1.000 

2.8 

0.061 

0.231 

0.469 

0.692 

0.848 

0.935 

0.976 

0.992 

0.998 

0.999 

3.0 

0.050 

0.199 

0.423 

0.647 

0.815 

0.916 

0.966 

0.988 

0.996 

0.999 

3.2 

0.041 

0.171 

0.380 

0.603 

0.781 

0.895 

0.955 

0.983 

0.994 

0.998 

3.4 

0.033 

0.147 

0.340 

0.558 

0.744 

0.871 

0.942 

0.977 

0.992 

0.997 

3.6 

0.027 

0.126 

0.303 

0.515 

0.706 

0.844 

0.927 

0.969 

0.988 

0.996 

3.8 

0.022 

0.107 

0.269 

0.473 

0.668 

0.816 

0.909 

0.960 

0.984 

0.994 

4.0 

0.018 

0.092 

0.238 

0.433 

0.629 

0.785 

0.889 

0.949 

0.979 

0.992 

4.2 

0.015 

0.078 

0.210 

0.395 

0.590 

0.753 

0.867 

0.936 

0.972 

0.989 

4.4 

0.012 

0.066 

0.185 

0.359 

0.551 

0.720 

0.844 

0.921 

0.964 

0.985 

4.6 

0.010 

0.056 

0.163 

0.326 

0.513 

0.686 

0.818 

0.905 

0.955 

0.980 

4.8 

0.008 

0.048 

0.143 

0.294 

0.476 

0.651 

0.791 

0.887 

0.944 

0.975 

5.0 

0.007 

0.040 

0.125 

0.265 

0.440 

0.616 

0.762 

0.867 

0.932 

0.968 

5.2 

0.006 

0.034 

0.109 

0.238 

0.406 

0.581 

0.732 

0.845 

0.918 

0.960 

5.4 

0.005 

0.029 

0.095 

0.213 

0.373 

0.546 

0.702 

0.822 

0.903 

0.951 

5.6 

0.004 

0.024 

0.082 

0.191 

0.342 

0.512 

0.670 

0.797 

0.886 

0.941 

5.8 

0.003 

0.021 

0.072 

0.170 

0.313 

0.478 

0.638 

0.771 

0.867 

0.929 

6.0 

0.002 

0.017 

0.062 

0.151 

0.285 

0.446 

0.606 

0.744 

0.847 

0.916 


10 

11 

12 

13 

14 

15 

16 




2.8 

1.000 










3.0 

1.000 










3.2 

1.000 










3.4 

0.999 

1.000 









3.6 

0.999 

1.000 









3.8 

0.998 

0.999 

1.000 








4.0 

0.997 

0.999 

1.000 








4.2 

0.996 

0.999 

1.000 








4.4 

0.994 

0.998 

0.999 

1.000 







4.6 

0.992 

0.997 

0.999 

1.000 







4.8 

0.990 

0.996 

0.999 

1.000 







5.0 

0.986 

0.995 

0.998 

0.999 

1.000 






5.2 

0.982 

0.993 

0.997 

0.999 

1.000 






5.4 

0.977 

0.990 

0.996 

0.999 

1.000 






5.6 

0.972 

0.988 

0.995 

0.998 

0.999 

1.000 





5.8 

0.965 

0.984 

0.993 

0.997 

0.999 

1.000 





6.0 

0.957 

0.980 

0.991 

0.996 

0.999 

0.999 

1.000 










Tablas 845 


Tabla 3 ( continua) 


\a 

A\\ 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

6.2 

0.002 

0.015 

0.054 

0.134 

0.259 

0.414 

0.574 

0.716 

0.826 

0.902 

6.4 

0.002 

0.012 

0.046 

0.119 

0.235 

0.384 

0.542 

0.687 

0.803 

0.886 

6.6 

0.001 

0.010 

0.040 

0.105 

0.213 

0.355 

0.511 

0.658 

0.780 

0.869 

6.8 

0.001 

0.009 

0.034 

0.093 

0.192 

0.327 

0.480 

0.628 

0.755 

0.850 

7.0 

0.001 

0.007 

0.030 

0.082 

0.173 

0.301 

0.450 

0.599 

0.729 

0.830 

7.2 

0.001 

0.006 

0.025 

0.072 

0.156 

0.276 

0.420 

0.569 

0.703 

0.810 

7.4 

0.001 

0.005 

0.022 

0.063 

0.140 

0.253 

0.392 

0.539 

0.676 

0.788 

7.6 

0.001 

0.004 

0.019 

0.055 

0.125 

0.231 

0.365 

0.510 

0.648 

0.765 

7.8 

0.000 

0.004 

0.016 

0.048 

0.112 

0.210 

0.338 

0.481 

0.620 

0.741 

8.0 

0.000 

0.003 

0.014 

0.042 

0.100 

0.191 

0.313 

0.453 

0.593 

0.717 

8.5 

0.000 

0.002 

0.009 

0.030 

0.074 

0.150 

0.256 

0.386 

0.523 

0.653 

9.0 

0.000 

0.001 

0.006 

0.021 

0.055 

0.116 

0.207 

0.324 

0.456 

0.587 

9.5 

0.000 

0.001 

0.004 

0.015 

0.040 

0.089 

0.165 

0.269 

0.392 

0.522 

10.0 

0.000 

0.000 

0.003 

0.010 

0.029 

0.067 

0.130 

0.220 

0.333 

0.458 


10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

6.2 

0.949 

0.975 

0.989 

0.995 

0.998 

0.999 

1.000 




6.4 

0.939 

0.969 

0.986 

0.994 

0.997 

0.999 

1.000 




6.6 

0.927 

0.963 

0.982 

0.992 

0.997 

0.999 

0.999 

1.000 



6.8 

0.915 

0.955 

0.978 

0.990 

0.996 

0.998 

0.999 

1.000 



7.0 

0.901 

0.947 

0.973 

0.987 

0.994 

0.998 

0.999 

1.000 



7.2 

0.887 

0.937 

0.967 

0.984 

0.993 

0.997 

0.999 

0.999 

1.000 


7.4 

0.871 

0.926 

0.961 

0.980 

0.991 

0.996 

0.998 

0.999 

1.000 


7.6 

0.854 

0.915 

0.954 

0.976 

0.989 

0.995 

0.998 

0.999 

1.000 


7.8 

0.835 

0.902 

0.945 

0.971 

0.986 

0.993 

0.997 

0.999 

1.000 


8.0 

0.816 

0.888 

0.936 

0.966 

0.983 

0.992 

0.996 

0.998 

0.999 

1.000 

8.5 

0.763 

0.849 

0.909 

0.949 

0.973 

0.986 

0.993 

0.997 

0.999 

0.999 

9.0 

0.706 

0.803 

0.876 

0.926 

0.959 

0.978 

0.989 

0.995 

0.998 

0.999 

9.5 

0.645 

0.752 

0.836 

0.898 

0.940 

0.967 

0.982 

0.991 

0.996 

0.998 

10.0 

0.583 

0.697 

0.792 

0.864 

0.917 

0.951 

0.973 

0.986 

0.993 

0.997 


20 

21 

22 








8.5 

1.000 










9.0 

1.000 










9.5 

0.999 

1.000 









10.0 

0.998 

0.999 

1.000 
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Apendice 3 


Tablas 


Tabla 3 ( continua) 


\a 

A\ 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10.5 

0.000 

0.000 

0.002 

0.007 

0.021 

0.050 

0.102 

0.179 

0.279 

0.397 

11.0 

0.000 

0.000 

0.001 

0.005 

0.015 

0.038 

0.079 

0.143 

0.232 

0.341 

11.5 

0.000 

0.000 

0.001 

0.003 

0.011 

0.028 

0.060 

0.114 

0.191 

0.289 

12.0 

0.000 

0.000 

0.001 

0.002 

0.008 

0.020 

0.046 

0.090 

0.155 

0.242 

12.5 

0.000 

0.000 

0.000 

0.002 

0.005 

0.015 

0.035 

0.070 

0.125 

0.201 

13.0 

0.000 

0.000 

0.000 

0.001 

0.004 

0.011 

0.026 

0.054 

0.100 

0.166 

13.5 

0.000 

0.000 

0.000 

0.001 

0.003 

0.008 

0.019 

0.041 

0.079 

0.135 

14.0 

0.000 

0.000 

0.000 

0.000 

0.002 

0.006 

0.014 

0.032 

0.062 

0.109 

14.5 

0.000 

0.000 

0.000 

0.000 

0.001 

0.004 

0.010 

0.024 

0.048 

0.088 

15.0 

0.000 

0.000 

0.000 

0.000 

0.001 

0.003 

0.008 

0.018 

0.037 

0.070 


10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

10.5 

0.521 

0.639 

0.742 

0.825 

0.888 

0.932 

0.960 

0.978 

0.988 

0.994 

11.0 

0.460 

0.579 

0.689 

0.781 

0.854 

0.907 

0.944 

0.968 

0.982 

0.991 

11.5 

0.402 

0.520 

0.633 

0.733 

0.815 

0.878 

0.924 

0.954 

0.974 

0.986 

12.0 

0.347 

0.462 

0.576 

0.682 

0.772 

0.844 

0.899 

0.937 

0.963 

0.979 

12.5 

0.297 

0.406 

0.519 

0.628 

0.725 

0.806 

0.869 

0.916 

0.948 

0.969 

13.0 

0.252 

0.353 

0.463 

0.573 

0.675 

0.764 

0.835 

0.890 

0.930 

0.957 

13.5 

0.211 

0.304 

0.409 

0.518 

0.623 

0.718 

0.798 

0.861 

0.908 

0.942 

14.0 

0.176 

0.260 

0.358 

0.464 

0.570 

0.669 

0.756 

0.827 

0.883 

0.923 

14.5 

0.145 

0.220 

0.311 

0.413 

0.518 

0.619 

0.711 

0.790 

0.853 

0.901 

15.0 

0.118 

0.185 

0.268 

0.363 

0.466 

0.568 

0.664 

0.749 

0.819 

0.875 


20 

21 

22 

23 

24 

25 

26 

27 

28 

29 

10.5 

0.997 

0.999 

0.999 

1.000 







11.0 

0.995 

0.998 

0.999 

1.000 







11.5 

0.992 

0.996 

0.998 

0.999 

1.000 






12.0 

0.988 

0.994 

0.997 

0.999 

0.999 

1.000 





12.5 

0.983 

0.991 

0.995 

0.998 

0.999 

0.999 

1.000 




13.0 

0.975 

0.986 

0.992 

0.996 

0.998 

0.999 

1.000 




13.5 

0.965 

0.980 

0.989 

0.994 

0.997 

0.998 

0.999 

1.000 



14.0 

0.952 

0.971 

0.983 

0.991 

0.995 

0.997 

0.999 

0.999 

1.000 


14.5 

0.936 

0.960 

0.976 

0.986 

0.992 

0.996 

0.998 

0.999 

0.999 

1.000 

15.0 

0.917 

0.947 

0.967 

0.981 

0.989 

0.994 

0.997 

0.998 

0.999 

1.000 









Tablas 847 


Tabla 3 ( continua) 


\a 

A \\ 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

16 

0.000 

0.001 

0.004 

0.010 

0.022 

0.043 

0.077 

0.127 

0.193 

0.275 

17 

0.000 

0.001 

0.002 

0.005 

0.013 

0.026 

0.049 

0.085 

0.135 

0.201 

18 

0.000 

0.000 

0.001 

0.003 

0.007 

0.015 

0.030 

0.055 

0.092 

0.143 

19 

0.000 

0.000 

0.001 

0.002 

0.004 

0.009 

0.018 

0.035 

0.061 

0.098 

20 

0.000 

0.000 

0.000 

0.001 

0.002 

0.005 

0.011 

0.021 

0.039 

0.066 

21 

0.000 

0.000 

0.000 

0.000 

0.001 

0.003 

0.006 

0.013 

0.025 

0.043 

22 

0.000 

0.000 

0.000 

0.000 

0.001 

0.002 

0.004 

0.008 

0.015 

0.028 

23 

0.000 

0.000 

0.000 

0.000 

0.000 

0.001 

0.002 

0.004 

0.009 

0.017 

24 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.001 

0.003 

0.005 

0.011 

25 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.001 

0.001 

0.003 

0.006 


14 

15 

16 

17 

18 

19 

20 

21 

22 

23 

16 

0.368 

0.467 

0.566 

0.659 

0.742 

0.812 

0.868 

0.911 

0.942 

0.963 

17 

0.281 

0.371 

0.468 

0.564 

0.655 

0.736 

0.805 

0.861 

0.905 

0.937 

18 

0.208 

0.287 

0.375 

0.469 

0.562 

0.651 

0.731 

0.799 

0.855 

0.899 

19 

0.150 

0.215 

0.292 

0.378 

0.469 

0.561 

0.647 

0.725 

0.793 

0.849 

20 

0.105 

0.157 

0.221 

0.297 

0.381 

0.470 

0.559 

0.644 

0.721 

0.787 

21 

0.072 

0.111 

0.163 

0.227 

0.302 

0.384 

0.471 

0.558 

0.640 

0.716 

22 

0.048 

0.077 

0.117 

0.169 

0.232 

0.306 

0.387 

0.472 

0.556 

0.637 

23 

0.031 

0.052 

0.082 

0.123 

0.175 

0.238 

0.310 

0.389 

0.472 

0.555 

24 

0.020 

0.034 

0.056 

0.087 

0.128 

0.180 

0.243 

0.314 

0.392 

0.473 

25 

0.012 

0.022 

0.038 

0.060 

0.092 

0.134 

0.185 

0.247 

0.318 

0.394 


24 

25 

26 

27 

28 

29 

30 

31 

32 

33 

16 

0.978 

0.987 

0.993 

0.996 

0.998 

0.999 

0.999 

1.000 



17 

0.959 

0.975 

0.985 

0.991 

0.995 

0.997 

0.999 

0.999 

1.000 


18 

0.932 

0.955 

0.972 

0.983 

0.990 

0.994 

0.997 

0.998 

0.999 

1.000 

19 

0.893 

0.927 

0.951 

0.969 

0.980 

0.988 

0.993 

0.996 

0.998 

0.999 

20 

0.843 

0.888 

0.922 

0.948 

0.966 

0.978 

0.987 

0.992 

0.995 

0.997 

21 

0.782 

0.838 

0.883 

0.917 

0.944 

0.963 

0.976 

0.985 

0.991 

0.994 

22 

0.712 

0.777 

0.832 

0.877 

0.913 

0.940 

0.959 

0.973 

0.983 

0.989 

23 

0.635 

0.708 

0.772 

0.827 

0.873 

0.908 

0.936 

0.956 

0.971 

0.981 

24 

0.554 

0.632 

0.704 

0.768 

0.823 

0.868 

0.904 

0.932 

0.953 

0.969 

25 

0.473 

0.553 

0.629 

0.700 

0.763 

0.818 

0.863 

0.900 

0.929 

0.950 


34 

35 

36 

37 

38 

39 

40 

41 

42 

43 

19 

0.999 

1.000 









20 

0.999 

0.999 

1.000 








21 

0.997 

0.998 

0.999 

0.999 

1.000 






22 

0.994 

0.996 

0.998 

0.999 

0.999 

1.000 





23 

0.988 

0.993 

0.996 

0.997 

0.999 

0.999 

1.000 




24 

0.979 

0.987 

0.992 

0.995 

0.997 

0.998 

0.999 

0.999 

1.000 


25 

0.966 

0.978 

0.985 

0.991 

0.991 

0.997 

0.998 

0.999 

0.999 

1.000 











848 Apendice 3 Tablas 


Tabla 4 Areas de curva normal 

Probabilidad normal estandar en cola derecha 

(para valores negativos de z, las areas se encuentran por simetri'a) 



z 




Segundo lugar decimal de <; 




.00 

.01 

.02 

.03 

.04 

.05 

.06 

.07 

.08 

.09 

0.0 

.5000 

.4960 

.4920 

.4880 

.4840 

.4801 

.4761 

.4721 

.4681 

.4641 

0.1 

.4602 

.4562 

.4522 

.4483 

.4443 

.4404 

.4364 

.4325 

.4286 

.4247 

0.2 

.4207 

.4168 

.4129 

.4090 

.4052 

.4013 

.3974 

.3936 

.3897 

.3859 

0.3 

.3821 

.3783 

.3745 

.3707 

.3669 

.3632 

.3594 

.3557 

.3520 

.3483 

0.4 

.3446 

.3409 

.3372 

.3336 

.3300 

.3264 

.3228 

.3192 

.3156 

.3121 

0.5 

.3085 

.3050 

.3015 

.2981 

.2946 

.2912 

.2877 

.2843 

.2810 

.2776 

0.6 

.2743 

.2709 

.2676 

.2643 

.2611 

.2578 

.2546 

.2514 

.2483 

.2451 

0.7 

.2420 

.2389 

.2358 

.2327 

.2296 

.2266 

.2236 

.2206 

.2177 

.2148 

0.8 

.2119 

.2090 

.2061 

.2033 

.2005 

.1977 

.1949 

.1922 

.1894 

.1867 

0.9 

.1841 

.1814 

.1788 

.1762 

.1736 

.1711 

.1685 

.1660 

.1635 

.1611 

1.0 

.1587 

.1562 

.1539 

.1515 

.1492 

.1469 

.1446 

.1423 

.1401 

.1379 

1.1 

.1357 

.1335 

.1314 

.1292 

.1271 

.1251 

.1230 

.1210 

.1190 

.1170 

1.2 

.1151 

.1131 

.1112 

.1093 

.1075 

.1056 

.1038 

.1020 

.1003 

.0985 

1.3 

.0968 

.0951 

.0934 

.0918 

.0901 

.0885 

.0869 

.0853 

.0838 

.0823 

1.4 

.0808 

.0793 

.0778 

.0764 

.0749 

.0735 

.0722 

.0708 

.0694 

.0681 

1.5 

.0668 

.0655 

.0643 

.0630 

.0618 

.0606 

.0594 

.0582 

.0571 

.0559 

1.6 

.0548 

.0537 

.0526 

.0516 

.0505 

.0495 

.0485 

.0475 

.0465 

.0455 

1.7 

.0446 

.0436 

.0427 

.0418 

.0409 

.0401 

.0392 

.0384 

.0375 

.0367 

1.8 

.0359 

.0352 

.0344 

.0336 

.0329 

.0322 

.0314 

.0307 

.0301 

.0294 

1.9 

.0287 

.0281 

.0274 

.0268 

.0262 

.0256 

.0250 

.0244 

.0239 

.0233 

2.0 

.0228 

.0222 

.0217 

.0212 

.0207 

.0202 

.0197 

.0192 

.0188 

.0183 

2.1 

.0179 

.0174 

.0170 

.0166 

.0162 

.0158 

.0154 

.0150 

.0146 

.0143 

2.2 

.0139 

.0136 

.0132 

.0129 

.0125 

.0122 

.0119 

.0116 

.0113 

.0110 

2.3 

.0107 

.0104 

.0102 

.0099 

.0096 

.0094 

.0091 

.0089 

.0087 

.0084 

2.4 

.0082 

.0080 

.0078 

.0075 

.0073 

.0071 

.0069 

.0068 

.0066 

.0064 

2.5 

.0062 

.0060 

.0059 

.0057 

.0055 

.0054 

.0052 

.0051 

.0049 

.0048 

2.6 

.0047 

.0045 

.0044 

.0043 

.0041 

.0040 

.0039 

.0038 

.0037 

.0036 

2.7 

.0035 

.0034 

.0033 

.0032 

.0031 

.0030 

.0029 

.0028 

.0027 

.0026 

2.8 

.0026 

.0025 

.0024 

.0023 

.0023 

.0022 

.0021 

.0021 

.0020 

.0019 

2.9 

.0019 

.0018 

.0017 

.0017 

.0016 

.0016 

.0015 

.0015 

.0014 

.0014 

3.0 

.00135 










3.5 

.000 233 









4.0 

.000 031 7 









4.5 

.000 003 40 









5.0 

.000 000 287 










De R . E . Walpole , Introduction to Statistics (New York : Macmillan , 1968 ). 








Tablas 849 


Tabla 5 Puntos porcentuales de las distribuciones t 



1. 100 

t. 050 

t. 025 

?. 010 

t. 005 

gl 

3.078 

6.314 

12.706 

31.821 

63.657 

1 

1.886 

2.920 

4.303 

6.965 

9.925 

2 

1.638 

2.353 

3.182 

4.541 

5.841 

3 

1.533 

2.132 

2.776 

3.747 

4.604 

4 

1.476 

2.015 

2.571 

3.365 

4.032 

5 

1.440 

1.943 

2.447 

3.143 

3.707 

6 

1.415 

1.895 

2.365 

2.998 

3.499 

7 

1.397 

1.860 

2.306 

2.896 

3.355 

8 

1.383 

1.833 

2.262 

2.821 

3.250 

9 

1.372 

1.812 

2.228 

2.764 

3.169 

10 

1.363 

1.796 

2.201 

2.718 

3.106 

11 

1.356 

1.782 

2.179 

2.681 

3.055 

12 

1.350 

1.771 

2.160 

2.650 

3.012 

13 

1.345 

1.761 

2.145 

2.624 

2.977 

14 

1.341 

1.753 

2.131 

2.602 

2.947 

15 

1.337 

1.746 

2.120 

2.583 

2.921 

16 

1.333 

1.740 

2.110 

2.567 

2.898 

17 

1.330 

1.734 

2.101 

2.552 

2.878 

18 

1.328 

1.729 

2.093 

2.539 

2.861 

19 

1.325 

1.725 

2.086 

2.528 

2.845 

20 

1.323 

1.721 

2.080 

2.518 

2.831 

21 

1.321 

1.717 

2.074 

2.508 

2.819 

22 

1.319 

1.714 

2.069 

2.500 

2.807 

23 

1.318 

1.711 

2.064 

2.492 

2.797 

24 

1.316 

1.708 

2.060 

2.485 

2.787 

25 

1.315 

1.706 

2.056 

2.479 

2.779 

26 

1.314 

1.703 

2.052 

2.473 

2.771 

27 

1.313 

1.701 

2.048 

2.467 

2.763 

28 

1.311 

1.699 

2.045 

2.462 

2.756 

29 

1.282 

1.645 

1.960 

2.326 

2.576 

inf. 


De “Table of Percentage Points of the f-Distribution”. Calculado por Maxine 
Merrington, Biometrika, Vol. 32 (1941), p. 300. 






850 Apendice 3 Tablas 


Tabla 6 Puntos porcentuales de las distribuciones x 2 


a 




0 

x* 



gl 

Xo.995 

X 0.990 

Xo.975 

Xo.950 

X 0.900 

1 

0.0000393 

0.0001571 

0.0009821 

0.0039321 

0.0157908 

2 

0.0100251 

0.0201007 

0.0506356 

0.102587 

0.210720 

3 

0.0717212 

0.114832 

0.215795 

0.351846 

0.584375 

4 

0.206990 

0.297110 

0.484419 

0.710721 

1.063623 

5 

0.411740 

0.554300 

0.831211 

1.145476 

1.61031 

6 

0.675727 

0.872085 

1.237347 

1.63539 

2.20413 

7 

0.989265 

1.239043 

1.68987 

2.16735 

2.83311 

8 

1.344419 

1.646482 

2.17973 

2.73264 

3.48954 

9 

1.734926 

2.087912 

2.70039 

3.32511 

4.16816 

10 

2.15585 

2.55821 

3.24697 

3.94030 

4.86518 

11 

2.60321 

3.05347 

3.81575 

4.57481 

5.57779 

12 

3.07382 

3.57056 

4.40379 

5.22603 

6.30380 

13 

3.56503 

4.10691 

5.00874 

5.89186 

7.04150 

14 

4.07468 

4.66043 

5.62872 

6.57063 

7.78953 

15 

4.60094 

5.22935 

6.26214 

7.26094 

8.54675 

16 

5.14224 

5.81221 

6.90766 

7.96164 

9.31223 

17 

5.69724 

6.40776 

7.56418 

8.67176 

10.0852 

18 

6.26481 

7.01491 

8.23075 

9.39046 

10.8649 

19 

6.84398 

7.63273 

8.90655 

10.1170 

11.6509 

20 

7.43386 

8.26040 

9.59083 

10.8508 

12.4426 

21 

8.03366 

8.89720 

10.28293 

11.5913 

13.2396 

22 

8.64272 

9.54249 

10.9823 

12.3380 

14.0415 

23 

9.26042 

10.19567 

11.6885 

13.0905 

14.8479 

24 

9.88623 

10.8564 

12.4011 

13.8484 

15.6587 

25 

10.5197 

11.5240 

13.1197 

14.6114 

16.4734 

26 

11.1603 

12.1981 

13.8439 

15.3791 

17.2919 

27 

11.8076 

12.8786 

14.5733 

16.1513 

18.1138 

28 

12.4613 

13.5648 

15.3079 

16.9279 

18.9392 

29 

13.1211 

14.2565 

16.0471 

17.7083 

19.7677 

30 

13.7867 

14.9535 

16.7908 

18.4926 

20.5992 

40 

20.7065 

22.1643 

24.4331 

26.5093 

29.0505 

50 

27.9907 

29.7067 

32.3574 

34.7642 

37.6886 

60 

35.5346 

37.4848 

40.4817 

43.1879 

46.4589 

70 

43.2752 

45.4418 

48.7576 

51.7393 

55.3290 

80 

51.1720 

53.5400 

57.1532 

60.3915 

64.2778 

90 

59.1963 

61.7541 

65.6466 

69.1260 

73.2912 

100 

67.3276 

70.0648 

74.2219 

77.9295 

82.3581 







Tablas 851 


Tabla 6 ( continua) 


Xo.ioo 

Xo.o50 

Xo.025 

Xo.oio 

Xo.oo5 

gl 

2.70554 

3.84146 

5.02389 

6.63490 

7.87944 

1 

4.60517 

5.99147 

7.37776 

9.21034 

10.5966 

2 

6.25139 

7.81473 

9.34840 

11.3449 

12.8381 

3 

7.77944 

9.48773 

11.1433 

13.2767 

14.8602 

4 

9.23635 

11.0705 

12.8325 

15.0863 

16.7496 

5 

10.6446 

12.5916 

14.4494 

16.8119 

18.5476 

6 

12.0170 

14.0671 

16.0128 

18.4753 

20.2777 

7 

13.3616 

15.5073 

17.5346 

20.0902 

21.9550 

8 

14.6837 

16.9190 

19.0228 

21.6660 

23.5893 

9 

15.9871 

18.3070 

20.4831 

23.2093 

25.1882 

10 

17.2750 

19.6751 

21.9200 

24.7250 

26.7569 

11 

18.5494 

21.0261 

23.3367 

26.2170 

28.2995 

12 

19.8119 

22.3621 

24.7356 

27.6883 

29.8194 

13 

21.0642 

23.6848 

26.1190 

29.1413 

31.3193 

14 

22.3072 

24.9958 

27.4884 

30.5779 

32.8013 

15 

23.5418 

26.2962 

28.8454 

31.9999 

34.2672 

16 

24.7690 

27.5871 

30.1910 

33.4087 

35.7185 

17 

25.9894 

28.8693 

31.5264 

34.8053 

37.1564 

18 

27.2036 

30.1435 

32.8523 

36.1908 

38.5822 

19 

28.4120 

31.4104 

34.1696 

37.5662 

39.9968 

20 

29.6151 

32.6705 

35.4789 

38.9321 

41.4010 

21 

30.8133 

33.9244 

36.7807 

40.2894 

42.7956 

22 

32.0069 

35.1725 

38.0757 

41.6384 

44.1813 

23 

33.1963 

36.4151 

39.3641 

42.9798 

45.5585 

24 

34.3816 

37.6525 

40.6465 

44.3141 

46.9278 

25 

35.5631 

38.8852 

41.9232 

45.6417 

48.2899 

26 

36.7412 

40.1133 

43.1944 

46.9630 

49.6449 

27 

37.9159 

41.3372 

44.4607 

48.2782 

50.9933 

28 

39.0875 

42.5569 

45.7222 

49.5879 

52.3356 

29 

40.2560 

43.7729 

46.9792 

50.8922 

53.6720 

30 

51.8050 

55.7585 

59.3417 

63.6907 

66.7659 

40 

63.1671 

67.5048 

71.4202 

76.1539 

79.4900 

50 

74.3970 

79.0819 

83.2976 

88.3794 

91.9517 

60 

85.5271 

90.5312 

95.0231 

100.425 

104.215 

70 

96.5782 

101.879 

106.629 

112.329 

116.321 

80 

107.565 

113.145 

118.136 

124.116 

128.299 

90 

118.498 

124.342 

129.561 

135.807 

140.169 

100 


De “Table of the Percentage Points of the x 2 -Distribution”. Calculado por Maxine 
Merrington, Biometrika, Vol. 32 (1941), pp.188-189, por Catherine M. Thompson. 





852 Apendice 3 Tablas 


Tabla 7 Puntos porcentuales de las distribuciones F 



GL del 
denominador 

GL del numerador 

a 

1 

2 

3 

4 

5 

6 

7 

8 

9 

1 

.100 

39.86 

49.50 

53.59 

55.83 

57.24 

58.20 

58.91 

59.44 

59.86 


.050 

161.4 

199.5 

215.7 

224.6 

230.2 

234.0 

236.8 

238.9 

240.5 


.025 

647.8 

799.5 

864.2 

899.6 

921.8 

937.1 

948.2 

956.7 

963.3 


.010 

4052 

4999.5 

5403 

5625 

5764 

5859 

5928 

5982 

6022 


.005 

16211 

20000 

21615 

22500 

23056 

23437 

23715 

23925 

24091 

2 

.100 

8.53 

9.00 

9.16 

9.24 

9.29 

9.33 

9.35 

9.37 

9.38 


.050 

18.51 

19.00 

19.16 

19.25 

19.30 

19.33 

19.35 

19.37 

19.38 


.025 

38.51 

39.00 

39.17 

39.25 

39.30 

39.33 

39.36 

39.37 

39.39 


.010 

98.50 

99.00 

99.17 

99.25 

99.30 

99.33 

99.36 

99.37 

99.39 


.005 

198.5 

199.0 

199.2 

199.2 

199.3 

199.3 

199.4 

199.4 

199.4 

3 

.100 

5.54 

5.46 

5.39 

5.34 

5.31 

5.28 

5.27 

5.25 

5.24 


.050 

10.13 

9.55 

9.28 

9.12 

9.01 

8.94 

8.89 

8.85 

8.81 


.025 

17.44 

16.04 

15.44 

15.10 

14.88 

14.73 

14.62 

14.54 

14.47 


.010 

34.12 

30.82 

29.46 

28.71 

28.24 

27.91 

27.67 

27.49 

27.35 


.005 

55.55 

49.80 

47.47 

46.19 

45.39 

44.84 

44.43 

44.13 

43.88 

4 

.100 

4.54 

4.32 

4.19 

4.11 

4.05 

4.01 

3.98 

3.95 

3.94 


.050 

7.71 

6.94 

6.59 

6.39 

6.26 

6.16 

6.09 

6.04 

6.00 


.025 

12.22 

10.65 

9.98 

9.60 

9.36 

9.20 

9.07 

8.98 

8.90 


.010 

21.20 

18.00 

16.69 

15.98 

15.52 

15.21 

14.98 

14.80 

14.66 


.005 

31.33 

26.28 

24.26 

23.15 

22.46 

21.97 

21.62 

21.35 

21.14 

5 

.100 

4.06 

3.78 

3.62 

3.52 

3.45 

3.40 

3.37 

3.34 

3.32 


.050 

6.61 

5.79 

5.41 

5.19 

5.05 

4.95 

4.88 

4.82 

4.77 


.025 

10.01 

8.43 

7.76 

7.39 

7.15 

6.98 

6.85 

6.76 

6.68 


.010 

16.26 

13.27 

12.06 

11.39 

10.97 

10.67 

10.46 

10.29 

10.16 


.005 

22.78 

18.31 

16.53 

15.56 

14.94 

14.51 

14.20 

13.96 

13.77 

6 

.100 

3.78 

3.46 

3.29 

3.18 

3.11 

3.05 

3.01 

2.98 

2.96 


.050 

5.99 

5.14 

4.76 

4.53 

4.39 

4.28 

4.21 

4.15 

4.10 


.025 

8.81 

7.26 

6.60 

6.23 

5.99 

5.82 

5.70 

5.60 

5.52 


.010 

13.75 

10.92 

9.78 

9.15 

8.75 

8.47 

8.26 

8.10 

7.98 


.005 

18.63 

14.54 

12.92 

12.03 

11.46 

11.07 

10.79 

10.57 

10.39 

7 

.100 

3.59 

3.26 

3.07 

2.96 

2.88 

2.83 

2.78 

2.75 

2.72 


.050 

5.59 

4.74 

4.35 

4.12 

3.97 

3.87 

3.79 

3.73 

3.68 


.025 

8.07 

6.54 

5.89 

5.52 

5.29 

5.12 

4.99 

4.90 

4.82 


.010 

12.25 

9.55 

8.45 

7.85 

7.46 

7.19 

6.99 

6.84 

6.72 


.005 

16.24 

12.40 

10.88 

10.05 

9.52 

9.16 

8.89 

8.68 

8.51 










Tablas 853 


GL del numerador 


10 

12 

15 

20 

24 

30 

40 

60 

120 

oo 

a 

gl 

60.19 

60.71 

61.22 

61.74 

62.00 

62.26 

62.53 

62.79 

63.06 

63.33 

.100 

1 

241.9 

243.9 

245.9 

248.0 

249.1 

250.1 

251.1 

252.2 

253.3 

254.3 

.050 


968.6 

976.7 

984.9 

993.1 

997.2 

1001 

1006 

1010 

1014 

1018 

.025 


6056 

6106 

6157 

6209 

6235 

6261 

6287 

6313 

6339 

6366 

.010 


24224 

24426 

24630 

24836 

24940 

25044 

25148 

25253 

25359 

25465 

.005 


9.39 

9.41 

9.42 

9.44 

9.45 

9.46 

9.47 

9.47 

9.48 

9.49 

.100 

2 

19.40 

19.41 

19.43 

19.45 

19.45 

19.45 

19.47 

19.48 

19.49 

19.50 

.050 


39.40 

39.41 

39.43 

39.45 

39.46 

39.46 

39.47 

39.48 

39.49 

39.50 

.025 


99.40 

99.42 

99.43 

99.45 

99.46 

99.47 

99.47 

99.48 

99.49 

99.50 

.010 


199.4 

199.4 

199.4 

199.4 

199.5 

199.5 

199.5 

199.5 

199.5 

199.5 

.005 


5.23 

5.22 

5.20 

5.18 

5.18 

5.17 

5.16 

5.15 

5.14 

5.13 

.100 

3 

8.79 

8.74 

8.70 

8.66 

8.64 

8.62 

8.59 

8.57 

8.55 

8.53 

.050 


14.42 

14.34 

14.25 

14.17 

14.12 

14.08 

14.04 

13.99 

13.95 

13.90 

.025 


27.23 

27.05 

26.87 

26.69 

26.60 

26.50 

26.41 

26.32 

26.22 

26.13 

.010 


43.69 

43.39 

43.08 

42.78 

42.62 

42.47 

42.31 

42.15 

41.99 

41.83 

.005 


3.92 

3.90 

3.87 

3.84 

3.83 

3.82 

3.80 

3.79 

3.78 

3.76 

.100 

4 

5.96 

5.91 

5.86 

5.80 

5.77 

5.75 

5.72 

5.69 

5.66 

5.63 

.050 


8.84 

8.75 

8.66 

8.56 

8.51 

8.46 

8.41 

8.36 

8.31 

8.26 

.025 


14.55 

14.37 

14.20 

14.02 

13.93 

13.84 

13.75 

13.65 

13.56 

13.46 

.010 


20.97 

20.70 

20.44 

20.17 

20.03 

19.89 

19.75 

19.61 

19.47 

19.32 

.005 


3.30 

3.27 

3.24 

3.21 

3.19 

3.17 

3.16 

3.14 

3.12 

3.10 

.100 

5 

4.74 

4.68 

4.62 

4.56 

4.53 

4.50 

4.46 

4.43 

4.40 

4.36 

.050 


6.62 

6.52 

6.43 

6.33 

6.28 

6.23 

6.18 

6.12 

6.07 

6.02 

.025 


10.05 

9.89 

9.72 

9.55 

9.47 

9.38 

9.29 

9.20 

9.11 

9.02 

.010 


13.62 

13.38 

13.15 

12.90 

12.78 

12.66 

12.53 

12.40 

12.27 

12.14 

.005 


2.94 

2.90 

2.87 

2.84 

2.82 

2.80 

2.78 

2.76 

2.74 

2.72 

.100 

6 

4.06 

4.00 

3.94 

3.87 

3.84 

3.81 

3.77 

3.74 

3.70 

3.67 

.050 


5.46 

5.37 

5.27 

5.17 

5.12 

5.07 

5.01 

4.96 

4.90 

4.85 

.025 


7.87 

7.72 

7.56 

7.40 

7.31 

7.23 

7.14 

7.06 

6.97 

6.88 

.010 


10.25 

10.03 

9.81 

9.59 

9.47 

9.36 

9.24 

9.12 

9.00 

8.88 

.005 


2.70 

2.67 

2.63 

2.59 

2.58 

2.56 

2.54 

2.51 

2.49 

2.47 

.100 

7 

3.64 

3.57 

3.51 

3.44 

3.41 

3.38 

3.34 

3.30 

3.27 

3.23 

.050 


4.76 

4.67 

4.57 

4.47 

4.42 

4.36 

4.31 

4.25 

4.20 

4.14 

.025 


6.62 

6.47 

6.31 

6.16 

6.07 

5.99 

5.91 

5.82 

5.74 

5.65 

.010 


8.38 

8.18 

7.97 

7.75 

7.65 

7.53 

7.42 

7.31 

7.19 

7.08 

.005 







854 Apendice 3 Tablas 


GL del 
denominador 

GL del numerador 

a 

1 

2 

3 

4 

5 

6 

7 

8 

9 

8 

.100 

3.46 

3.11 

2.92 

2.81 

2.73 

2.67 

2.62 

2.59 

2.56 


.050 

5.32 

4.46 

4.07 

3.84 

3.69 

3.58 

3.50 

3.44 

3.39 


.025 

7.57 

6.06 

5.42 

5.05 

4.82 

4.65 

4.53 

4.43 

4.36 


.010 

11.26 

8.65 

7.59 

7.01 

6.63 

6.37 

6.18 

6.03 

5.91 


.005 

14.69 

11.04 

9.60 

8.81 

8.30 

7.95 

7.69 

7.50 

7.34 

9 

.100 

3.36 

3.01 

2.81 

2.69 

2.61 

2.55 

2.51 

2.47 

2.44 


.050 

5.12 

4.26 

3.86 

3.63 

3.48 

3.37 

3.29 

3.23 

3.18 


.025 

7.21 

5.71 

5.08 

4.72 

4.48 

4.32 

4.20 

4.10 

4.03 


.010 

10.56 

8.02 

6.99 

6.42 

6.06 

5.80 

5.61 

5.47 

5.35 


.005 

13.61 

10.11 

8.72 

7.96 

7.47 

7.13 

6.88 

6.69 

6.54 

10 

.100 

3.29 

2.92 

2.73 

2.61 

2.52 

2.46 

2.41 

2.38 

2.35 


.050 

4.96 

4.10 

3.71 

3.48 

3.33 

3.22 

3.14 

3.07 

3.02 


.025 

6.94 

5.46 

4.83 

4.47 

4.24 

4.07 

3.95 

3.85 

3.78 


.010 

10.04 

7.56 

6.55 

5.99 

5.64 

5.39 

5.20 

5.06 

4.94 


.005 

12.83 

9.43 

8.08 

7.34 

6.87 

6.54 

6.30 

6.12 

5.97 

11 

.100 

3.23 

2.86 

2.66 

2.54 

2.45 

2.39 

2.34 

2.30 

2.27 


.050 

4.84 

3.98 

3.59 

3.36 

3.20 

3.09 

3.01 

2.95 

2.90 


.025 

6.72 

5.26 

4.63 

4.28 

4.04 

3.88 

3.76 

3.66 

3.59 


.010 

9.65 

7.21 

6.22 

5.67 

5.32 

5.07 

4.89 

4.74 

4.63 


.005 

12.23 

8.91 

7.60 

6.88 

6.42 

6.10 

5.86 

5.68 

5.54 

12 

.100 

3.18 

2.81 

2.61 

2.48 

2.39 

2.33 

2.28 

2.24 

2.21 


.050 

4.75 

3.89 

3.49 

3.26 

3.11 

3.00 

2.91 

2.85 

2.80 


.025 

6.55 

5.10 

4.47 

4.12 

3.89 

3.73 

3.61 

3.51 

3.44 


.010 

9.33 

6.93 

5.95 

5.41 

5.06 

4.82 

4.64 

4.50 

4.39 


.005 

11.75 

8.51 

7.23 

6.52 

6.07 

5.76 

5.52 

5.35 

5.20 

13 

.100 

3.14 

2.76 

2.56 

2.43 

2.35 

2.28 

2.23 

2.20 

2.16 


.050 

4.67 

3.81 

3.41 

3.18 

3.03 

2.92 

2.83 

2.77 

2.71 


.025 

6.41 

4.97 

4.35 

4.00 

3.77 

3.60 

3.48 

3.39 

3.31 


.010 

9.07 

6.70 

5.74 

5.21 

4.86 

4.62 

4.44 

4.30 

4.19 


.005 

11.37 

8.19 

6.93 

6.23 

5.79 

5.48 

5.25 

5.08 

4.94 

14 

.100 

3.10 

2.73 

2.52 

2.39 

2.31 

2.24 

2.19 

2.15 

2.12 


.050 

4.60 

3.74 

3.34 

3.11 

2.96 

2.85 

2.76 

2.70 

2.65 


.025 

6.30 

4.86 

4.24 

3.89 

3.66 

3.50 

3.38 

3.29 

3.21 


.010 

8.86 

6.51 

5.56 

5.04 

4.69 

4.46 

4.28 

4.14 

4.03 


.005 

11.06 

7.92 

6.68 

6.00 

5.56 

5.26 

5.03 

4.86 

4.72 






Tablas 855 


GL del numerador 


10 

12 

15 

20 

24 

30 

40 

60 

120 

oo 

a 

gl 

2.54 

2.50 

2.46 

2.42 

2.40 

2.38 

2.36 

2.34 

2.32 

2.29 

.100 

8 

3.35 

3.28 

3.22 

3.15 

3.12 

3.08 

3.04 

3.01 

2.97 

2.93 

.050 


4.30 

4.20 

4.10 

4.00 

3.95 

3.89 

3.84 

3.78 

3.73 

3.67 

.025 


5.81 

5.67 

5.52 

5.36 

5.28 

5.20 

5.12 

5.03 

4.95 

4.86 

.010 


7.21 

7.01 

6.81 

6.61 

6.50 

6.40 

6.29 

6.18 

6.06 

5.95 

.005 


2.42 

2.38 

2.34 

2.30 

2.28 

2.25 

2.23 

2.21 

2.18 

2.16 

.100 

9 

3.14 

3.07 

3.01 

2.94 

2.90 

2.86 

2.83 

2.79 

2.75 

2.71 

.050 


3.96 

3.87 

3.77 

3.67 

3.61 

3.56 

3.51 

3.45 

3.39 

3.33 

.025 


5.26 

5.11 

4.96 

4.81 

4.73 

4.65 

4.57 

4.48 

4.40 

4.31 

.010 


6.42 

6.23 

6.03 

5.83 

5.73 

5.62 

5.52 

5.41 

5.30 

5.19 

.005 


2.32 

2.28 

2.24 

2.20 

2.18 

2.16 

2.13 

2.11 

2.08 

2.06 

.100 

10 

2.98 

2.91 

2.85 

2.77 

2.74 

2.70 

2.66 

2.62 

2.58 

2.54 

.050 


3.72 

3.62 

3.52 

3.42 

3.37 

3.31 

3.26 

3.20 

3.14 

3.08 

.025 


4.85 

4.71 

4.56 

4.41 

4.33 

4.25 

4.17 

4.08 

4.00 

3.91 

.010 


5.85 

5.66 

5.47 

5.27 

5.17 

5.07 

4.97 

4.86 

4.75 

4.64 

.005 


2.25 

2.21 

2.17 

2.12 

2.10 

2.08 

2.05 

2.03 

2.00 

1.97 

.100 

11 

2.85 

2.79 

2.72 

2.65 

2.61 

2.57 

2.53 

2.49 

2.45 

2.40 

.050 


3.53 

3.43 

3.33 

3.23 

3.17 

3.12 

3.06 

3.00 

2.94 

2.88 

.025 


4.54 

4.40 

4.25 

4.10 

4.02 

3.94 

3.86 

3.78 

3.69 

3.60 

.010 


5.42 

5.24 

5.05 

4.86 

4.76 

4.65 

4.55 

4.44 

4.34 

4.23 

.005 


2.19 

2.15 

2.10 

2.06 

2.04 

2.01 

1.99 

1.96 

1.93 

1.90 

.100 

12 

2.75 

2.69 

2.62 

2.54 

2.51 

2.47 

2.43 

2.38 

2.34 

2.30 

.050 


3.37 

3.28 

3.18 

3.07 

3.02 

2.96 

2.91 

2.85 

2.79 

2.72 

.025 


4.30 

4.16 

4.01 

3.86 

3.78 

3.70 

3.62 

3.54 

3.45 

3.36 

.010 


5.09 

4.91 

4.72 

4.53 

4.43 

4.33 

4.23 

4.12 

4.01 

3.90 

.005 


2.14 

2.10 

2.05 

2.01 

1.98 

1.96 

1.93 

1.90 

1.88 

1.85 

.100 

13 

2.67 

2.60 

2.53 

2.46 

2.42 

2.38 

2.34 

2.30 

2.25 

2.21 

.050 


3.25 

3.15 

3.05 

2.95 

2.89 

2.84 

2.78 

2.72 

2.66 

2.60 

.025 


4.10 

3.96 

3.82 

3.66 

3.59 

3.51 

3.43 

3.34 

3.25 

3.17 

.010 


4.82 

4.64 

4.46 

4.27 

4.17 

4.07 

3.97 

3.87 

3.76 

3.65 

.005 


2.10 

2.05 

2.01 

1.96 

1.94 

1.91 

1.89 

1.86 

1.83 

1.80 

.100 

14 

2.60 

2.53 

2.46 

2.39 

2.35 

2.31 

2.27 

2.22 

2.18 

2.13 

.050 


3.15 

3.05 

2.95 

2.84 

2.79 

2.73 

2.67 

2.61 

2.55 

2.49 

.025 


3.94 

3.80 

3.66 

3.51 

3.43 

3.35 

3.27 

3.18 

3.09 

3.00 

.010 


4.60 

4.43 

4.25 

4.06 

3.96 

3.86 

3.76 

3.66 

3.55 

3.44 

.005 







856 Apendice 3 Tablas 


GL del 
denominador 

GL del numerador 

a 

1 

2 

3 

4 

5 

6 

7 

8 

9 

15 

.100 

3.07 

2.70 

2.49 

2.36 

2.27 

2.21 

2.16 

2.12 

2.09 


.050 

4.54 

3.68 

3.29 

3.06 

2.90 

2.79 

2.71 

2.64 

2.59 


.025 

6.20 

4.77 

4.15 

3.80 

3.58 

3.41 

3.29 

3.20 

3.12 


.010 

8.68 

6.36 

5.42 

4.89 

4.56 

4.32 

4.14 

4.00 

3.89 


.005 

10.80 

7.70 

6.48 

5.80 

5.37 

5.07 

4.85 

4.67 

4.54 

16 

.100 

3.05 

2.67 

2.46 

2.33 

2.24 

2.18 

2.13 

2.09 

2.06 


.050 

4.49 

3.63 

3.24 

3.01 

2.85 

2.74 

2.66 

2.59 

2.54 


.025 

6.12 

4.69 

4.08 

3.73 

3.50 

3.34 

3.22 

3.12 

3.05 


.010 

8.53 

6.23 

5.29 

4.77 

4.44 

4.20 

4.03 

3.89 

3.78 


.005 

10.58 

7.51 

6.30 

5.64 

5.21 

4.91 

4.69 

4.52 

4.38 

17 

.100 

3.03 

2.64 

2.44 

2.31 

2.22 

2.15 

2.10 

2.06 

2.03 


.050 

4.45 

3.59 

3.20 

2.96 

2.81 

2.70 

2.61 

2.55 

2.49 


.025 

6.04 

4.62 

4.01 

3.66 

3.44 

3.28 

3.16 

3.06 

2.98 


.010 

8.40 

6.11 

5.18 

4.67 

4.34 

4.10 

3.93 

3.79 

3.68 


.005 

10.38 

7.35 

6.16 

5.50 

5.07 

4.78 

4.56 

4.39 

4.25 

18 

.100 

3.01 

2.62 

2.42 

2.29 

2.20 

2.13 

2.08 

2.04 

2.00 


.050 

4.41 

3.55 

3.16 

2.93 

2.77 

2.66 

2.58 

2.51 

2.46 


.025 

5.98 

4.56 

3.95 

3.61 

3.38 

3.22 

3.10 

3.01 

2.93 


.010 

8.29 

6.01 

5.09 

4.58 

4.25 

4.01 

3.84 

3.71 

3.60 


.005 

10.22 

7.21 

6.03 

5.37 

4.96 

4.66 

4.44 

4.28 

4.14 

19 

.100 

2.99 

2.61 

2.40 

2.27 

2.18 

2.11 

2.06 

2.02 

1.98 


.050 

4.38 

3.52 

3.13 

2.90 

2.74 

2.63 

2.54 

2.48 

2.42 


.025 

5.92 

4.51 

3.90 

3.56 

3.33 

3.17 

3.05 

2.96 

2.88 


.010 

8.18 

5.93 

5.01 

4.50 

4.17 

3.94 

3.77 

3.63 

3.52 


.005 

10.07 

7.09 

5.92 

5.27 

4.85 

4.56 

4.34 

4.18 

4.04 

20 

.100 

2.97 

2.59 

2.38 

2.25 

2.16 

2.09 

2.04 

2.00 

1.96 


.050 

4.35 

3.49 

3.10 

2.87 

2.71 

2.60 

2.51 

2.45 

2.39 


.025 

5.87 

4.46 

3.86 

3.51 

3.29 

3.13 

3.01 

2.91 

2.84 


.010 

8.10 

5.85 

4.94 

4.43 

4.10 

3.87 

3.70 

3.56 

3.46 


.005 

9.94 

6.99 

5.82 

5.17 

4.76 

4.47 

4.26 

4.09 

3.96 

21 

.100 

2.96 

2.57 

2.36 

2.23 

2.14 

2.08 

2.02 

1.98 

1.95 


.050 

4.32 

3.47 

3.07 

2.84 

2.68 

2.57 

2.49 

2.42 

2.37 


.025 

5.83 

4.42 

3.82 

3.48 

3.25 

3.09 

2.97 

2.87 

2.80 


.010 

8.02 

5.78 

4.87 

4.37 

4.04 

3.81 

3.64 

3.51 

3.40 


.005 

9.83 

6.89 

5.73 

5.09 

4.68 

4.39 

4.18 

4.01 

3.88 






Tablas 857 


Tabla 7 ( continua) 

F a 

GL del numerador 


10 

12 

15 

20 

24 

30 

40 

60 

120 

oo 

a 

gl 

2.06 

2.02 

1.97 

1.92 

1.90 

1.87 

1.85 

1.82 

1.79 

1.76 

.100 

15 

2.54 

2.48 

2.40 

2.33 

2.29 

2.25 

2.20 

2.16 

2.11 

2.07 

.050 


3.06 

2.96 

2.86 

2.76 

2.70 

2.64 

2.59 

2.52 

2.46 

2.40 

.025 


3.80 

3.67 

3.52 

3.37 

3.29 

3.21 

3.13 

3.05 

2.96 

2.87 

.010 


4.42 

4.25 

4.07 

3.88 

3.79 

3.69 

3.58 

3.48 

3.37 

3.26 

.005 


2.03 

1.99 

1.94 

1.89 

1.87 

1.84 

1.81 

1.78 

1.75 

1.72 

.100 

16 

2.49 

2.42 

2.35 

2.28 

2.24 

2.19 

2.15 

2.11 

2.06 

2.01 

.050 


2.99 

2.89 

2.79 

2.68 

2.63 

2.57 

2.51 

2.45 

2.38 

2.32 

.025 


3.69 

3.55 

3.41 

3.26 

3.18 

3.10 

3.02 

2.93 

2.84 

2.75 

.010 


4.27 

4.10 

3.92 

3.73 

3.64 

3.54 

3.44 

3.33 

3.22 

3.11 

.005 


2.00 

1.96 

1.91 

1.86 

1.84 

1.81 

1.78 

1.75 

1.72 

1.69 

.100 

17 

2.45 

2.38 

2.31 

2.23 

2.19 

2.15 

2.10 

2.06 

2.01 

1.96 

.050 


2.92 

2.82 

2.72 

2.62 

2.56 

2.50 

2.44 

2.38 

2.32 

2.25 

.025 


3.59 

3.46 

3.31 

3.16 

3.08 

3.00 

2.92 

2.83 

2.75 

2.65 

.010 


4.14 

3.97 

3.79 

3.61 

3.51 

3.41 

3.31 

3.21 

3.10 

2.98 

.005 


1.98 

1.93 

1.89 

1.84 

1.81 

1.78 

1.75 

1.72 

1.69 

1.66 

.100 

18 

2.41 

2.34 

2.27 

2.19 

2.15 

2.11 

2.06 

2.02 

1.97 

1.92 

.050 


2.87 

2.77 

2.67 

2.56 

2.50 

2.44 

2.38 

2.32 

2.26 

2.19 

.025 


3.51 

3.37 

3.23 

3.08 

3.00 

2.92 

2.84 

2.75 

2.66 

2.57 

.010 


4.03 

3.86 

3.68 

3.50 

3.40 

3.30 

3.20 

3.10 

2.99 

2.87 

.005 


1.96 

1.91 

1.86 

1.81 

1.79 

1.76 

1.73 

1.70 

1.67 

1.63 

.100 

19 

2.38 

2.31 

2.23 

2.16 

2.11 

2.07 

2.03 

1.98 

1.93 

1.88 

.050 


2.82 

2.72 

2.62 

2.51 

2.45 

2.39 

2.33 

2.27 

2.20 

2.13 

.025 


3.43 

3.30 

3.15 

3.00 

2.92 

2.84 

2.76 

2.67 

2.58 

2.49 

.010 


3.93 

3.76 

3.59 

3.40 

3.31 

3.21 

3.11 

3.00 

2.89 

2.78 

.005 


1.94 

1.89 

1.84 

1.79 

1.77 

1.74 

1.71 

1.68 

1.64 

1.61 

.100 

20 

2.35 

2.28 

2.20 

2.12 

2.08 

2.04 

1.99 

1.95 

1.90 

1.84 

.050 


2.77 

2.68 

2.57 

2.46 

2.41 

2.35 

2.29 

2.22 

2.16 

2.09 

.025 


3.37 

3.23 

3.09 

2.94 

2.86 

2.78 

2.69 

2.61 

2.52 

2.42 

.010 


3.85 

3.68 

3.50 

3.32 

3.22 

3.12 

3.02 

2.92 

2.81 

2.69 

.005 


1.92 

1.87 

1.83 

1.78 

1.75 

1.72 

1.69 

1.66 

1.62 

1.59 

.100 

21 

2.32 

2.25 

2.18 

2.10 

2.05 

2.01 

1.96 

1.92 

1.87 

1.81 

.050 


2.73 

2.64 

2.53 

2.42 

2.37 

2.31 

2.25 

2.18 

2.11 

2.04 

.025 


3.31 

3.17 

3.03 

2.88 

2.80 

2.72 

2.64 

2.55 

2.46 

2.36 

.010 


3.77 

3.60 

3.43 

3.24 

3.15 

3.05 

2.95 

2.84 

2.73 

2.61 

.005 
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GL del 
denominador 

GL del numerador 

a 

1 

2 

3 

4 

5 

6 

7 

8 

9 

22 

.100 

2.95 

2.56 

2.35 

2.22 

2.13 

2.06 

2.01 

1.97 

1.93 


.050 

4.30 

3.44 

3.05 

2.82 

2.66 

2.55 

2.46 

2.40 

2.34 


.025 

5.79 

4.38 

3.78 

3.44 

3.22 

3.05 

2.93 

2.84 

2.76 


.010 

7.95 

5.72 

4.82 

4.31 

3.99 

3.76 

3.59 

3.45 

3.35 


.005 

9.73 

6.81 

5.65 

5.02 

4.61 

4.32 

4.11 

3.94 

3.81 

23 

.100 

2.94 

2.55 

2.34 

2.21 

2.11 

2.05 

1.99 

1.95 

1.92 


.050 

4.28 

3.42 

3.03 

2.80 

2.64 

2.53 

2.44 

2.37 

2.32 


.025 

5.75 

4.35 

3.75 

3.41 

3.18 

3.02 

2.90 

2.81 

2.73 


.010 

7.88 

5.66 

4.76 

4.26 

3.94 

3.71 

3.54 

3.41 

3.30 


.005 

9.63 

6.73 

5.58 

4.95 

4.54 

4.26 

4.05 

3.88 

3.75 

24 

.100 

2.93 

2.54 

2.33 

2.19 

2.10 

2.04 

1.98 

1.94 

1.91 


.050 

4.26 

3.40 

3.01 

2.78 

2.62 

2.51 

2.42 

2.36 

2.30 


.025 

5.72 

4.32 

3.72 

3.38 

3.15 

2.99 

2.87 

2.78 

2.70 


.010 

7.82 

5.61 

4.72 

4.22 

3.90 

3.67 

3.50 

3.36 

3.26 


.005 

9.55 

6.66 

5.52 

4.89 

4.49 

4.20 

3.99 

3.83 

3.69 

25 

.100 

2.92 

2.53 

2.32 

2.18 

2.09 

2.02 

1.97 

1.93 

1.89 


.050 

4.24 

3.39 

2.99 

2.76 

2.60 

2.49 

2.40 

2.34 

2.28 


.025 

5.69 

4.29 

3.69 

3.35 

3.13 

2.97 

2.85 

2.75 

2.68 


.010 

7.77 

5.57 

4.68 

4.18 

3.85 

3.63 

3.46 

3.32 

3.22 


.005 

9.48 

6.60 

5.46 

4.84 

4.43 

4.15 

3.94 

3.78 

3.64 

26 

.100 

2.91 

2.52 

2.31 

2.17 

2.08 

2.01 

1.96 

1.92 

1.88 


.050 

4.23 

3.37 

2.98 

2.74 

2.59 

2.47 

2.39 

2.32 

2.27 


.025 

5.66 

4.27 

3.67 

3.33 

3.10 

2.94 

2.82 

2.73 

2.65 


.010 

7.72 

5.53 

4.64 

4.14 

3.82 

3.59 

3.42 

3.29 

3.18 


.005 

9.41 

6.54 

5.41 

4.79 

4.38 

4.10 

3.89 

3.73 

3.60 

27 

.100 

2.90 

2.51 

2.30 

2.17 

2.07 

2.00 

1.95 

1.91 

1.87 


.050 

4.21 

3.35 

2.96 

2.73 

2.57 

2.46 

2.37 

2.31 

2.25 


.025 

5.63 

4.24 

3.65 

3.31 

3.08 

2.92 

2.80 

2.71 

2.63 


.010 

7.68 

5.49 

4.60 

4.11 

3.78 

3.56 

3.39 

3.26 

3.15 


.005 

9.34 

6.49 

5.36 

4.74 

4.34 

4.06 

3.85 

3.69 

3.56 

28 

.100 

2.89 

2.50 

2.29 

2.16 

2.06 

2.00 

1.94 

1.90 

1.87 


.050 

4.20 

3.34 

2.95 

2.71 

2.56 

2.45 

2.36 

2.29 

2.24 


.025 

5.61 

4.22 

3.63 

3.29 

3.06 

2.90 

2.78 

2.69 

2.61 


.010 

7.64 

5.45 

4.57 

4.07 

3.75 

3.53 

3.36 

3.23 

3.12 


.005 

9.28 

6.44 

5.32 

4.70 

4.30 

4.02 

3.81 

3.65 

3.52 






Tablas 859 


Tabla 7 (continua) 

_ Fg 

GL del numerador 


10 

12 

15 

20 

24 

30 

40 

60 

120 

oo 

a 

gl 

1.90 

1.86 

1.81 

1.76 

1.73 

1.70 

1.67 

1.64 

1.60 

1.57 

.100 

22 

2.30 

2.23 

2.15 

2.07 

2.03 

1.98 

1.94 

1.89 

1.84 

1.78 

.050 


2.70 

2.60 

2.50 

2.39 

2.33 

2.27 

2.21 

2.14 

2.08 

2.00 

.025 


3.26 

3.12 

2.98 

2.83 

2.75 

2.67 

2.58 

2.50 

2.40 

2.31 

.010 


3.70 

3.54 

3.36 

3.18 

3.08 

2.98 

2.88 

2.77 

2.66 

2.55 

.005 


1.89 

1.84 

1.80 

1.74 

1.72 

1.69 

1.66 

1.62 

1.59 

1.55 

.100 

23 

2.27 

2.20 

2.13 

2.05 

2.01 

1.96 

1.91 

1.86 

1.81 

1.76 

.050 


2.67 

2.57 

2.47 

2.36 

2.30 

2.24 

2.18 

2.11 

2.04 

1.97 

.025 


3.21 

3.07 

2.93 

2.78 

2.70 

2.62 

2.54 

2.45 

2.35 

2.26 

.010 


3.64 

3.47 

3.30 

3.12 

3.02 

2.92 

2.82 

2.71 

2.60 

2.48 

.005 


1.88 

1.83 

1.78 

1.73 

1.70 

1.67 

1.64 

1.61 

1.57 

1.53 

.100 

24 

2.25 

2.18 

2.11 

2.03 

1.98 

1.94 

1.89 

1.84 

1.79 

1.73 

.050 


2.64 

2.54 

2.44 

2.33 

2.27 

2.21 

2.15 

2.08 

2.01 

1.94 

.025 


3.17 

3.03 

2.89 

2.74 

2.66 

2.58 

2.49 

2.40 

2.31 

2.21 

.010 


3.59 

3.42 

3.25 

3.06 

2.97 

2.87 

2.77 

2.66 

2.55 

2.43 

.005 


1.87 

1.82 

1.77 

1.72 

1.69 

1.66 

1.63 

1.59 

1.56 

1.52 

.100 

25 

2.24 

2.16 

2.09 

2.01 

1.96 

1.92 

1.87 

1.82 

1.77 

1.71 

.050 


2.61 

2.51 

2.41 

2.30 

2.24 

2.18 

2.12 

2.05 

1.98 

1.91 

.025 


3.13 

2.99 

2.85 

2.70 

2.62 

2.54 

2.45 

2.36 

2.27 

2.17 

.010 


3.54 

3.37 

3.20 

3.01 

2.92 

2.82 

2.72 

2.61 

2.50 

2.38 

.005 


1.86 

1.81 

1.76 

1.71 

1.68 

1.65 

1.61 

1.58 

1.54 

1.50 

.100 

26 

2.22 

2.15 

2.07 

1.99 

1.95 

1.90 

1.85 

1.80 

1.75 

1.69 

.050 


2.59 

2.49 

2.39 

2.28 

2.22 

2.16 

2.09 

2.03 

1.95 

1.88 

.025 


3.09 

2.96 

2.81 

2.66 

2.58 

2.50 

2.42 

2.33 

2.23 

2.13 

.010 


3.49 

3.33 

3.15 

2.97 

2.87 

2.77 

2.67 

2.56 

2.45 

2.33 

.005 


1.85 

1.80 

1.75 

1.70 

1.67 

1.64 

1.60 

1.57 

1.53 

1.49 

.100 

27 

2.20 

2.13 

2.06 

1.97 

1.93 

1.88 

1.84 

1.79 

1.73 

1.67 

.050 


2.57 

2.47 

2.36 

2.25 

2.19 

2.13 

2.07 

2.00 

1.93 

1.85 

.025 


3.06 

2.93 

2.78 

2.63 

2.55 

2.47 

2.38 

2.29 

2.20 

2.10 

.010 


3.45 

3.28 

3.11 

2.93 

2.83 

2.73 

2.63 

2.52 

2.41 

2.29 

.005 


1.84 

1.79 

1.74 

1.69 

1.66 

1.63 

1.59 

1.56 

1.52 

1.48 

.100 

28 

2.19 

2.12 

2.04 

1.96 

1.91 

1.87 

1.82 

1.77 

1.71 

1.65 

.050 


2.55 

2.45 

2.34 

2.23 

2.17 

2.11 

2.05 

1.98 

1.91 

1.83 

.025 


3.03 

2.90 

2.75 

2.60 

2.52 

2.44 

2.35 

2.26 

2.17 

2.06 

.010 


3.41 

3.25 

3.07 

2.89 

2.79 

2.69 

2.59 

2.48 

2.37 

2.25 

.005 
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GL del 
denominador 

GL del numerador 

a 

1 

2 

3 

4 

5 

6 

7 

8 

9 

29 

.100 

2.89 

2.50 

2.28 

2.15 

2.06 

1.99 

1.93 

1.89 

1.86 


.050 

4.18 

3.33 

2.93 

2.70 

2.55 

2.43 

2.35 

2.28 

2.22 


.025 

5.59 

4.20 

3.61 

3.27 

3.04 

2.88 

2.76 

2.67 

2.59 


.010 

7.60 

5.42 

4.54 

4.04 

3.73 

3.50 

3.33 

3.20 

3.09 


.005 

9.23 

6.40 

5.28 

4.66 

4.26 

3.98 

3.77 

3.61 

3.48 

30 

.100 

2.88 

2.49 

2.28 

2.14 

2.05 

1.98 

1.93 

1.88 

1.85 


.050 

4.17 

3.32 

2.92 

2.69 

2.53 

2.42 

2.33 

2.27 

2.21 


.025 

5.57 

4.18 

3.59 

3.25 

3.03 

2.87 

2.75 

2.65 

2.57 


.010 

7.56 

5.39 

4.51 

4.02 

3.70 

3.47 

3.30 

3.17 

3.07 


.005 

9.18 

6.35 

5.24 

4.62 

4.23 

3.95 

3.74 

3.58 

3.45 

40 

.100 

2.84 

2.44 

2.23 

2.09 

2.00 

1.93 

1.87 

1.83 

1.79 


.050 

4.08 

3.23 

2.84 

2.61 

2.45 

2.34 

2.25 

2.18 

2.12 


.025 

5.42 

4.05 

3.46 

3.13 

2.90 

2.74 

2.62 

2.53 

2.45 


.010 

7.31 

5.18 

4.31 

3.83 

3.51 

3.29 

3.12 

2.99 

2.89 


.005 

8.83 

6.07 

4.98 

4.37 

3.99 

3.71 

3.51 

3.35 

3.22 

60 

.100 

2.79 

2.39 

2.18 

2.04 

1.95 

1.87 

1.82 

1.77 

1.74 


.050 

4.00 

3.15 

2.76 

2.53 

2.37 

2.25 

2.17 

2.10 

2.04 


.025 

5.29 

3.93 

3.34 

3.01 

2.79 

2.63 

2.51 

2.41 

2.33 


.010 

7.08 

4.98 

4.13 

3.65 

3.34 

3.12 

2.95 

2.82 

2.72 


.005 

8.49 

5.79 

4.73 

4.14 

3.76 

3.49 

3.29 

3.13 

3.01 

120 

.100 

2.75 

2.35 

2.13 

1.99 

1.90 

1.82 

1.77 

1.72 

1.68 


.050 

3.92 

3.07 

2.68 

2.45 

2.29 

2.17 

2.09 

2.02 

1.96 


.025 

5.15 

3.80 

3.23 

2.89 

2.67 

2.52 

2.39 

2.30 

2.22 


.010 

6.85 

4.79 

3.95 

3.48 

3.17 

2.96 

2.79 

2.66 

2.56 


.005 

8.18 

5.54 

4.50 

3.92 

3.55 

3.28 

3.09 

2.93 

2.81 

oo 

.100 

2.71 

2.30 

2.08 

1.94 

1.85 

1.77 

1.72 

1.67 

1.63 


.050 

3.84 

3.00 

2.60 

2.37 

2.21 

2.10 

2.01 

1.94 

1.88 


.025 

5.02 

3.69 

3.12 

2.79 

2.57 

2.41 

2.29 

2.19 

2.11 


.010 

6.63 

4.61 

3.78 

3.32 

3.02 

2.80 

2.64 

2.51 

2.41 


.005 

7.88 

5.30 

4.28 

3.72 

3.35 

3.09 

2.90 

2.74 

2.62 


De “Tables of percentage points of the inverted beta ( F ) distribution ”. Biometrika , Vol . 33 ( 1943 ) por M . Merrington 
y C . M . Thompson y de la Tabla 18 de Biometrika Tables for Statisticians , Vol . 1 , Cambridge University Press , 1954 , 
editado por E . S . Pearson y H . O . Hartley . 







Tablas 861 


GL del numerador 


10 

12 

15 

20 

24 

30 

40 

60 

120 

oo 

a 

gl 

1.83 

1.78 

1.73 

1.68 

1.65 

1.62 

1.58 

1.55 

1.51 

1.47 

.100 

29 

2.18 

2.10 

2.03 

1.94 

1.90 

1.85 

1.81 

1.75 

1.70 

1.64 

.050 


2.53 

2.43 

2.32 

2.21 

2.15 

2.09 

2.03 

1.96 

1.89 

1.81 

.025 


3.00 

2.87 

2.73 

2.57 

2.49 

2.41 

2.33 

2.23 

2.14 

2.03 

.010 


3.38 

3.21 

3.04 

2.86 

2.76 

2.66 

2.56 

2.45 

2.33 

2.21 

.005 


1.82 

1.77 

1.72 

1.67 

1.64 

1.61 

1.57 

1.54 

1.50 

1.46 

.100 

30 

2.16 

2.09 

2.01 

1.93 

1.89 

1.84 

1.79 

1.74 

1.68 

1.62 

.050 


2.51 

2.41 

2.31 

2.20 

2.14 

2.07 

2.01 

1.94 

1.87 

1.79 

.025 


2.98 

2.84 

2.70 

2.55 

2.47 

2.39 

2.30 

2.21 

2.11 

2.01 

.010 


3.34 

3.18 

3.01 

2.82 

2.73 

2.63 

2.52 

2.42 

2.30 

2.18 

.005 


1.76 

1.71 

1.66 

1.61 

1.57 

1.54 

1.51 

1.47 

1.42 

1.38 

.100 

40 

2.08 

2.00 

1.92 

1.84 

1.79 

1.74 

1.69 

1.64 

1.58 

1.51 

.050 


2.39 

2.29 

2.18 

2.07 

2.01 

1.94 

1.88 

1.80 

1.72 

1.64 

.025 


2.80 

2.66 

2.52 

2.37 

2.29 

2.20 

2.11 

2.02 

1.92 

1.80 

.010 


3.12 

2.95 

2.78 

2.60 

2.50 

2.40 

2.30 

2.18 

2.06 

1.93 

.005 


1.71 

1.66 

1.60 

1.54 

1.51 

1.48 

1.44 

1.40 

1.35 

1.29 

.100 

60 

1.99 

1.92 

1.84 

1.75 

1.70 

1.65 

1.59 

1.53 

1.47 

1.39 

.050 


2.27 

2.17 

2.06 

1.94 

1.88 

1.82 

1.74 

1.67 

1.58 

1.48 

.025 


2.63 

2.50 

2.35 

2.20 

2.12 

2.03 

1.94 

1.84 

1.73 

1.60 

.010 


2.90 

2.74 

2.57 

2.39 

2.29 

2.19 

2.08 

1.96 

1.83 

1.69 

.005 


1.65 

1.60 

1.55 

1.48 

1.45 

1.41 

1.37 

1.32 

1.26 

1.19 

.100 

120 

1.91 

1.83 

1.75 

1.66 

1.61 

1.55 

1.50 

1.43 

1.35 

1.25 

.050 


2.16 

2.05 

1.94 

1.82 

1.76 

1.69 

1.61 

1.53 

1.43 

1.31 

.025 


2.47 

2.34 

2.19 

2.03 

1.95 

1.86 

1.76 

1.66 

1.53 

1.38 

.010 


2.71 

2.54 

2.37 

2.19 

2.09 

1.98 

1.87 

1.75 

1.61 

1.43 

.005 


1.60 

1.55 

1.49 

1.42 

1.38 

1.34 

1.30 

1.24 

1.17 

1.00 

.100 

OO 

1.83 

1.75 

1.67 

1.57 

1.52 

1.46 

1.39 

1.32 

1.22 

1.00 

.050 


2.05 

1.94 

1.83 

1.71 

1.64 

1.57 

1.48 

1.39 

1.27 

1.00 

.025 


2.32 

2.18 

2.04 

1.88 

1.79 

1.70 

1.59 

1.47 

1.32 

1.00 

.010 


2.52 

2.36 

2.19 

2.00 

1.90 

1.79 

1.67 

1.53 

1.36 

1.00 

.005 
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Tabla 8 Funcion de distribution de U 

P(U < U 0 ); Uo es el 
argumento ; n \ ^ n 2 \ 


3 < n 2 — 10. 

tl 2 = 3 





«i 



U 0 1 

2 

3 


0 .25 

.10 

.05 


1 .50 

.20 

.10 


2 

.40 

.20 


3 

.60 

.35 


4 


.50 


n 2 = 4 




n i 

l/o 1 

2 

3 

4 

0 .2000 

.0667 

.0286 

.0143 

1 .4000 

.1333 

.0571 

.0286 

2 .6000 

.2667 

.1143 

.0571 

3 

.4000 

.2000 

.1000 

4 

.6000 

.3143 

.1714 

5 


.4286 

.2429 

6 


.5714 

.3429 

7 



.4429 

8 



.5571 










Tablas 863 


Tabla 8 ( continua) 


n 2 = 5 


U 0 



n \ 



1 

2 

3 

4 

5 

0 

.1667 

.0476 

.0179 

.0079 

.0040 

1 

.3333 

.0952 

.0357 

.0159 

.0079 

2 

.5000 

.1905 

.0714 

.0317 

.0159 

3 


.2857 

.1250 

.0556 

.0278 

4 


.4286 

.1964 

.0952 

.0476 

5 


.5714 

.2857 

.1429 

.0754 

6 



.3929 

.2063 

.1111 

7 



.5000 

.2778 

.1548 

8 




.3651 

.2103 

9 




.4524 

.2738 

10 




.5476 

.3452 

11 





.4206 

12 





.5000 


«2 = 

6 









n i 




u 0 

1 

2 

3 

4 

5 

6 

0 

.1429 

.0357 

.0119 

.0048 

.0022 

.0011 

1 

.2857 

.0714 

.0238 

.0095 

.0043 

.0022 

2 

.4286 

.1429 

.0476 

.0190 

.0087 

.0043 

3 

.5714 

.2143 

.0833 

.0333 

.0152 

.0076 

4 


.3214 

.1310 

.0571 

.0260 

.0130 

5 


.4286 

.1905 

.0857 

.0411 

.0206 

6 


.5714 

.2738 

.1286 

.0628 

.0325 

7 



.3571 

.1762 

.0887 

.0465 

8 



.4524 

.2381 

.1234 

.0660 

9 



.5476 

.3048 

.1645 

.0898 

10 




.3810 

.2143 

.1201 

11 




.4571 

.2684 

.1548 

12 




.5429 

.3312 

.1970 

13 





.3961 

.2424 

14 





.4654 

.2944 

15 





.5346 

.3496 

16 






.4091 

17 






.4686 

18 






.5314 










864 Apendice 3 Tablas 


Tabla 8 ( continua) 


ri 2 = 7 


Uq 




n i 




1 

2 

3 

4 

5 

6 

7 

0 

.1250 

.0278 

.0083 

.0030 

.0013 

.0006 

.0003 

1 

.2500 

.0556 

.0167 

.0061 

.0025 

.0012 

.0006 

2 

.3750 

.1111 

.0333 

.0121 

.0051 

.0023 

.0012 

3 

.5000 

.1667 

.0583 

.0212 

.0088 

.0041 

.0020 

4 


.2500 

.0917 

.0364 

.0152 

.0070 

.0035 

5 


.3333 

.1333 

.0545 

.0240 

.0111 

.0055 

6 


.4444 

.1917 

.0818 

.0366 

.0175 

.0087 

7 


.5556 

.2583 

.1152 

.0530 

.0256 

.0131 

8 



.3333 

.1576 

.0745 

.0367 

.0189 

9 



.4167 

.2061 

.1010 

.0507 

.0265 

10 



.5000 

.2636 

.1338 

.0688 

.0364 

11 




.3242 

.1717 

.0903 

.0487 

12 




.3939 

.2159 

.1171 

.0641 

13 




.4636 

.2652 

.1474 

.0825 

14 




.5364 

.3194 

.1830 

.1043 

15 





.3775 

.2226 

.1297 

16 





.4381 

.2669 

.1588 

17 





.5000 

.3141 

.1914 

18 






.3654 

.2279 

19 






.4178 

.2675 

20 






.4726 

.3100 

21 






.5274 

.3552 

22 







.4024 

23 







.4508 

24 







.5000 






Tablas 865 


Tabla 8 ( continua) 


ri2 = 8 


U 0 




Hi 





1 

2 

3 

4 

5 

6 

7 

8 

0 

.1111 

.0222 

.0061 

.0020 

.0008 

.0003 

.0002 

.0001 

1 

.2222 

.0444 

.0121 

.0040 

.0016 

.0007 

.0003 

.0002 

2 

.3333 

.0889 

.0242 

.0081 

.0031 

.0013 

.0006 

.0003 

3 

.4444 

.1333 

.0424 

.0141 

.0054 

.0023 

.0011 

.0005 

4 

.5556 

.2000 

.0667 

.0242 

.0093 

.0040 

.0019 

.0009 

5 


.2667 

.0970 

.0364 

.0148 

.0063 

.0030 

.0015 

6 


.3556 

.1394 

.0545 

.0225 

.0100 

.0047 

.0023 

7 


.4444 

.1879 

.0768 

.0326 

.0147 

.0070 

.0035 

8 


.5556 

.2485 

.1071 

.0466 

.0213 

.0103 

.0052 

9 



.3152 

.1414 

.0637 

.0296 

.0145 

.0074 

10 



.3879 

.1838 

.0855 

.0406 

.0200 

.0103 

11 



.4606 

.2303 

.1111 

.0539 

.0270 

.0141 

12 



.5394 

.2848 

.1422 

.0709 

.0361 

.0190 

13 




.3414 

.1772 

.0906 

.0469 

.0249 

14 




.4040 

.2176 

.1142 

.0603 

.0325 

15 




.4667 

.2618 

.1412 

.0760 

.0415 

16 




.5333 

.3108 

.1725 

.0946 

.0524 

17 





.3621 

.2068 

.1159 

.0652 

18 





.4165 

.2454 

.1405 

.0803 

19 





.4716 

.2864 

.1678 

.0974 

20 





.5284 

.3310 

.1984 

.1172 

21 






.3773 

.2317 

.1393 

22 






.4259 

.2679 

.1641 

23 






.4749 

.3063 

.1911 

24 






.5251 

.3472 

.2209 

25 







.3894 

.2527 

26 







.4333 

.2869 

27 







.4775 

.3227 

28 







.5225 

.3605 

29 








.3992 

30 








.4392 

31 








.4796 

32 








.5204 






866 Apendice 3 Tablas 


Tabla 8 ( continua) 


ri 2 = 9 


U 0 





ni 





1 

2 

3 

4 

5 

6 

7 

8 

9 

0 

.1000 

.0182 

.0045 

.0014 

.0005 

.0002 

.0001 

.0000 

.0000 

1 

.2000 

.0364 

.0091 

.0028 

.0010 

.0004 

.0002 

.0001 

.0000 

2 

.3000 

.0727 

.0182 

.0056 

.0020 

.0008 

.0003 

.0002 

.0001 

3 

.4000 

.1091 

.0318 

.0098 

.0035 

.0014 

.0006 

.0003 

.0001 

4 

.5000 

.1636 

.0500 

.0168 

.0060 

.0024 

.0010 

.0005 

.0002 

5 


.2182 

.0727 

.0252 

.0095 

.0038 

.0017 

.0008 

.0004 

6 


.2909 

.1045 

.0378 

.0145 

.0060 

.0026 

.0012 

.0006 

7 


.3636 

.1409 

.0531 

.0210 

.0088 

.0039 

.0019 

.0009 

8 


.4545 

.1864 

.0741 

.0300 

.0128 

.0058 

.0028 

.0014 

9 


.5455 

.2409 

.0993 

.0415 

.0180 

.0082 

.0039 

.0020 

10 



.3000 

.1301 

.0559 

.0248 

.0115 

.0056 

.0028 

11 



.3636 

.1650 

.0734 

.0332 

.0156 

.0076 

.0039 

12 



.4318 

.2070 

.0949 

.0440 

.0209 

.0103 

.0053 

13 



.5000 

.2517 

.1199 

.0567 

.0274 

.0137 

.0071 

14 




.3021 

.1489 

.0723 

.0356 

.0180 

.0094 

15 




.3552 

.1818 

.0905 

.0454 

.0232 

.0122 

16 




.4126 

.2188 

.1119 

.0571 

.0296 

.0157 

17 




.4699 

.2592 

.1361 

.0708 

.0372 

.0200 

18 




.5301 

.3032 

.1638 

.0869 

.0464 

.0252 

19 





.3497 

.1942 

.1052 

.0570 

.0313 

20 





.3986 

.2280 

.1261 

.0694 

.0385 

21 





.4491 

.2643 

.1496 

.0836 

.0470 

22 





.5000 

.3035 

.1755 

.0998 

.0567 

23 






.3445 

.2039 

.1179 

.0680 

24 






.3878 

.2349 

.1383 

.0807 

25 






.4320 

.2680 

.1606 

.0951 

26 






.4773 

.3032 

.1852 

.1112 

27 






.5227 

.3403 

.2117 

.1290 

28 







.3788 

.2404 

.1487 

29 







.4185 

.2707 

.1701 

30 







.4591 

.3029 

.1933 

31 







.5000 

.3365 

.2181 

32 








.3715 

.2447 

33 








.4074 

.2729 

34 








.4442 

.3024 

35 








.4813 

.3332 

36 








.5187 

.3652 

37 









.3981 

38 









.4317 

39 









.4657 

40 









.5000 






Tablas 867 


Tabla 8 ( continua) 


ri2 = 10 


Uo 





n i 






1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

0 

.0909 

.0152 

.0035 

.0010 

.0003 

.0001 

.0001 

.0000 

.0000 

.0000 

1 

.1818 

.0303 

.0070 

.0020 

.0007 

.0002 

.0001 

.0000 

.0000 

.0000 

2 

.2727 

.0606 

.0140 

.0040 

.0013 

.0005 

.0002 

.0001 

.0000 

.0000 

3 

.3636 

.0909 

.0245 

.0070 

.0023 

.0009 

.0004 

.0002 

.0001 

.0000 

4 

.4545 

.1364 

.0385 

.0120 

.0040 

.0015 

.0006 

.0003 

.0001 

.0001 

5 

.5455 

.1818 

.0559 

.0180 

.0063 

.0024 

.0010 

.0004 

.0002 

.0001 

6 


.2424 

.0804 

.0270 

.0097 

.0037 

.0015 

.0007 

.0003 

.0002 

7 


.3030 

.1084 

.0380 

.0140 

.0055 

.0023 

.0010 

.0005 

.0002 

8 


.3788 

.1434 

.0529 

.0200 

.0080 

.0034 

.0015 

.0007 

.0004 

9 


.4545 

.1853 

.0709 

.0276 

.0112 

.0048 

.0022 

.0011 

.0005 

10 


.5455 

.2343 

.0939 

.0376 

.0156 

.0068 

.0031 

.0015 

.0008 

11 



.2867 

.1199 

.0496 

.0210 

.0093 

.0043 

.0021 

.0010 

12 



.3462 

.1518 

.0646 

.0280 

.0125 

.0058 

.0028 

.0014 

13 



.4056 

.1868 

.0823 

.0363 

.0165 

.0078 

.0038 

.0019 

14 



.4685 

.2268 

.1032 

.0467 

.0215 

.0103 

.0051 

.0026 

15 



.5315 

.2697 

.1272 

.0589 

.0277 

.0133 

.0066 

.0034 

16 




.3177 

.1548 

.0736 

.0351 

.0171 

.0086 

.0045 

17 




.3666 

.1855 

.0903 

.0439 

.0217 

.0110 

.0057 

18 




.4196 

.2198 

.1099 

.0544 

.0273 

.0140 

.0073 

19 




.4725 

.2567 

.1317 

.0665 

.0338 

.0175 

.0093 

20 




.5275 

.2970 

.1566 

.0806 

.0416 

.0217 

.0116 

21 





.3393 

.1838 

.0966 

.0506 

.0267 

.0144 

22 





.3839 

.2139 

.1148 

.0610 

.0326 

.0177 

23 





.4296 

.2461 

.1349 

.0729 

.0394 

.0216 

24 





.4765 

.2811 

.1574 

.0864 

.0474 

.0262 

25 





.5235 

.3177 

.1819 

.1015 

.0564 

.0315 

26 






.3564 

.2087 

.1185 

.0667 

.0376 

27 






.3962 

.2374 

.1371 

.0782 

.0446 

28 






.4374 

.2681 

.1577 

.0912 

.0526 

29 






.4789 

.3004 

.1800 

.1055 

.0615 

30 






.5211 

.3345 

.2041 

.1214 

.0716 

31 







.3698 

.2299 

.1388 

.0827 

32 







.4063 

.2574 

.1577 

.0952 

33 







.4434 

.2863 

.1781 

.1088 

34 







.4811 

.3167 

.2001 

.1237 

35 







.5189 

.3482 

.2235 

.1399 

36 








.3809 

.2483 

.1575 

37 








.4143 

.2745 

.1763 

38 








.4484 

.3019 

.1965 

39 








.4827 

.3304 

.2179 






868 Apendice 3 Tablas 


Tabla 8 (continua) 
ri2 — 10 


n i 


U 0 1 23456789 10 


40 

.5173 .3598 

.2406 

41 

.3901 

.2644 

42 

.4211 

.2894 

43 

.4524 

.3153 

44 

.4841 

.3421 

45 

.5159 

.3697 

46 


.3980 

47 


.4267 

48 


.4559 

49 


.4853 

50 


.5147 


Calculado por M. Pagano, Department of Statistics, University of Florida. 


Tabla 9 Valores criticos de T en los pares acoplados de Wilcoxon: Prueba de rangos con signo, 
n = 5(1)50 


Un lado 

Dos lados 

n = 5 

n — 6 

n = 1 

w = 8 

77 = 9 

77 = 10 

P = .05 

Z 3 = .10 

i 

2 

4 

6 

8 

11 

P = .025 

Z 3 = .05 


1 

2 

4 

6 

8 

P = .01 

P = .02 



0 

2 

3 

5 

P = .005 

P = .01 




0 

2 

3 

Un lado 

Dos lados 

n = 11 

« = 12 

n = 13 

77 = 14 

77 = 15 

77 = 16 

P = .05 

P = .10 

14 

17 

21 

26 

30 

36 

P = .025 

P = .05 

11 

14 

17 

21 

25 

30 

P = .01 

Z 3 = .02 

7 

10 

13 

16 

20 

24 

P = .005 

Z 3 = .01 

5 

7 

10 

13 

16 

19 

Un lado 

Dos lados 

n = 17 

M = 18 

17 — 19 

77 = 20 

77 = 21 

77 = 22 

P = .05 

P = .10 

41 

47 

54 

60 

68 

75 

P = .025 

P = .05 

35 

40 

46 

52 

59 

66 

P = .01 

P = .02 

28 

33 

38 

43 

49 

56 

P = .005 

P = .01 

23 

28 

32 

37 

43 

49 

Un lado 

Dos lados 

n = 23 

n = 24 

n = 25 

77 = 26 

77 = 27 

77 = 28 

P = .05 

Z 3 = .10 

83 

92 

101 

110 

120 

130 

P = .025 

P = .05 

73 

81 

90 

98 

107 

117 

Z 3 = .01 

P = .02 

62 

69 

77 

85 

93 

102 

P = .005 

P = .01 

55 

68 

68 

76 

84 

92 














Tablas 869 


Tabla 9 ( continua) 


Un lado 

Dos lados 

n = 29 

n = 30 

n = 31 

n = 32 

n = 33 

n = 34 

P = .05 

P = .10 

141 

152 

163 

175 

188 

201 

P = .025 

P = .05 

127 

137 

148 

159 

171 

183 

P = .01 

P = .02 

111 

120 

130 

141 

151 

162 

P = .005 

P = .01 

100 

109 

118 

128 

138 

149 

Un lado 

Dos lados 

n = 35 

n = 36 

n = 37 

w = 38 

n= 39 


P = .05 

P = .10 

214 

228 

242 

256 

271 


P = .025 

P = .05 

195 

208 

222 

235 

250 


P = .01 

P = .02 

174 

186 

198 

211 

224 


P = .005 

P = .01 

160 

171 

183 

195 

208 


Un lado 

Dos lados 

n = 40 

n = 41 

w = 42 

n =43 

n = 44 

n =45 

P = .05 

P = .10 

287 

303 

319 

336 

353 

371 

P = .025 

P = .05 

264 

279 

295 

311 

327 

344 

P = .01 

P = .02 

238 

252 

267 

281 

297 

313 

P = .005 

P = .01 

221 

234 

248 

262 

277 

292 

Un lado 

Dos lados 

rc = 46 

n =47 

n = 48 

n = 49 

n =50 


P = .05 

P = .10 

389 

408 

427 

446 

466 


P = .025 

P = .05 

361 

379 

397 

415 

434 


P = .01 

P = .02 

329 

345 

362 

380 

398 


P = .005 

/> = .01 

307 

323 

339 

356 

373 



De “Some Rapid Approximate Statistical Procedures” (1964), 28, F. Wilcoxon y R. A. Wilcox. 











870 Apendice 3 Tablas 


Tabla 10 Distribution del numero total de corridas R en muestras de tamano ( n i, 02 ), P(R ^ a) 

a 

( n u n 2 ) 2345 67 8 9 10 


( 2 , 3 ) 

.200 

.500 

.900 

1.000 

( 2 , 4 ) 

.133 

.400 

.800 

1.000 

( 2 , 5 ) 

.095 

.333 

.714 

1.000 

( 2 , 6 ) 

.071 

.286 

.643 

1.000 

( 2 , 7 ) 

.056 

.250 

.583 

1.000 

( 2 , 8 ) 

.044 

.222 

.533 

1.000 

( 2 , 9 ) 

.036 

.200 

.491 

1.000 

( 2 , 10 ) 

.030 

.182 

.455 

1.000 

( 3 , 3 ) 

.100 

.300 

.700 

.900 

( 3 , 4 ) 

.057 

.200 

.543 

.800 

( 3 , 5 ) 

.036 

.143 

.429 

.714 

( 3 , 6 ) 

.024 

.107 

.345 

.643 

( 3 , 7 ) 

.017 

.083 

.283 

.583 

( 3 , 8 ) 

.012 

.067 

.236 

.533 

( 3 , 9 ) 

.009 

.055 

.200 

.491 

( 3 , 10 ) 

.007 

.045 

.171 

.455 

( 4 , 4 ) 

.029 

.114 

.371 

.629 

( 4 , 5 ) 

.016 

.071 

.262 

.500 

( 4 , 6 ) 

.010 

.048 

.190 

.405 

( 4 , 7 ) 

.006 

.033 

.142 

.333 

( 4 , 8 ) 

.004 

.024 

.109 

.279 

( 4 , 9 ) 

.003 

.018 

.085 

.236 

( 4 , 10 ) 

.002 

.014 

.068 

.203 

( 5 , 5 ) 

.008 

.040 

.167 

.357 

( 5 , 6 ) 

.004 

.024 

.110 

.262 

( 5 , 7 ) 

.003 

.015 

.076 

.197 

( 5 , 8 ) 

.002 

.010 

.054 

.152 

( 5 , 9 ) 

.001 

.007 

.039 

.119 

( 5 , 10 ) 

.001 

.005 

.029 

.095 

( 6 , 6 ) 

.002 

.013 

.067 

.175 

( 6 , 7 ) 

.001 

.008 

.043 

.121 

( 6 , 8 ) 

.001 

.005 

.028 

.086 

( 6 , 9 ) 

.000 

.003 

.019 

.063 

( 6 , 10 ) 

.000 

.002 

.013 

.047 

( 7 , 7 ) 

.001 

.004 

.025 

.078 

( 7 , 8 ) 

.000 

.002 

.015 

.051 

( 7 , 9 ) 

.000 

.001 

.010 

.035 

( 7 , 10 ) 

.000 

.001 

.006 

.024 

( 8 , 8 ) 

.000 

.001 

.009 

.032 

( 8 , 9 ) 

.000 

.001 

.005 

.020 

( 8 , 10 ) 

.000 

.000 

.003 

.013 

( 9 , 9 ) 

.000 

.000 

.003 

.012 

( 9 , 10 ) 

.000 

.000 

.002 

.008 

( 10 , 10 ) 

.000 

.000 

.001 

.004 


1.000 


.971 

1.000 




.929 

1.000 




.881 

1.000 




.833 

1.000 




.788 

1.000 




.745 

1.000 




.706 

1.000 




.886 

.971 

1.000 



.786 

.929 

.992 

1.000 


.690 

.881 

.976 

1.000 


.606 

.833 

.954 

1.000 


.533 

.788 

.929 

1.000 


.471 

.745 

.902 

1.000 


.419 

.706 

.874 

1.000 


.643 

.833 

.960 

.992 

1.000 

.522 

.738 

.911 

.976 

.998 

.424 

.652 

.854 

.955 

.992 

.347 

.576 

.793 

.929 

.984 

.287 

.510 

.734 

.902 

.972 

.239 

.455 

.678 

.874 

.958 

.392 

.608 

.825 

.933 

.987 

.296 

.500 

.733 

.879 

.966 

.226 

.413 

.646 

.821 

.937 

.175 

.343 

.566 

.762 

.902 

.137 

.288 

.497 

.706 

.864 

.209 

.383 

.617 

.791 

.922 

.149 

.296 

.514 

.704 

.867 

.108 

.231 

.427 

.622 

.806 

.080 

.182 

.355 

.549 

.743 

.100 

.214 

.405 

.595 

.786 

.069 

.157 

.319 

.500 

.702 

.048 

.117 

.251 

.419 

.621 

.044 

.109 

.238 

.399 

.601 

.029 

.077 

.179 

.319 

.510 

.019 

.051 

.128 

.242 

.414 






Tablas 871 


Tabla 10 ( continua ) 

a 


( n u n 2 ) 11 12 13 14 15 16 17 18 19 20 


( 2 . 3 ) 

( 2 . 4 ) 

( 2 . 5 ) 
( 2 , 6 ) 
( 2 , 7 ) 
( 2 , 8 ) 
( 2 , 9 ) 
( 2 , 10 ) 

( 3 . 3 ) 

( 3 . 4 ) 

( 3 . 5 ) 

( 3 . 6 ) 

( 3 . 7 ) 

( 3 . 8 ) 

( 3 . 9 ) 
( 3 , 10 ) 

( 4 , 4 ) 

( 4 . 5 ) 
( 4 , 6 ) 
( 4 , 7 ) 
( 4 , 8 ) 
( 4 , 9 ) 
( 4 , 10 ) 

( 5 . 5 ) 


( 5 , 6 ) 

1.000 








( 5 , 7 ) 

1.000 








( 5 , 8 ) 

1.000 








( 5 , 9 ) 

1.000 








( 5 , 10 ) 

1.000 








( 6 , 6 ) 

.998 

1.000 







( 6 , 7 ) 

.992 

.999 

1.000 






( 6 , 8 ) 

.984 

.998 

1.000 






( 6 , 9 ) 

.972 

.994 

1.000 






( 6 , 10 ) 

.958 

.990 

1.000 






( 7 , 7 ) 

.975 

.996 

.999 

1.000 





( 7 , 8 ) 

.949 

.988 

.998 

1.000 

1.000 




( 7 , 9 ) 

.916 

.975 

.994 

.999 

1.000 




( 7 , 10 ) 

.879 

.957 

.990 

.998 

1.000 




( 8 , 8 ) 

.900 

.968 

.991 

.999 

1.000 

1.000 



( 8 , 9 ) 

.843 

.939 

.980 

.996 

.999 

1.000 

1.000 


( 8 , 10 ) 

.782 

.903 

.964 

.990 

.998 

1.000 

1.000 


( 9 , 9 ) 

.762 

.891 

.956 

.988 

.997 

1.000 

1.000 

1.000 

( 9 , 10 ) 

.681 

.834 

.923 

.974 

.992 

.999 

1.000 

1.000 

( 10 , 10 ) 

.586 

.758 

.872 

.949 

.981 

.996 

.999 

1.000 


De “Tables for Testing Randomness of Grouping in a Sequence of Alternatives”, C. Eisenhart y F. Swed, 
Annals of Mathematical Statistics, Volumen 14 (1943). 
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Apendice 3 


Tablas 


Tabla 11 Valores cri'ticos de coeficiente de correlacion 
de rango de Spearman 


n 

a — .05 

a = .025 

a = .01 

a = .005 

5 

0.900 

— 

— 

— 

6 

0.829 

0.886 

0.943 

— 

7 

0.714 

0.786 

0.893 

— 

8 

0.643 

0.738 

0.833 

0.881 

9 

0.600 

0.683 

0.783 

0.833 

10 

0.564 

0.648 

0.745 

0.794 

11 

0.523 

0.623 

0.736 

0.818 

12 

0.497 

0.591 

0.703 

0.780 

13 

0.475 

0.566 

0.673 

0.745 

14 

0.457 

0.545 

0.646 

0.716 

15 

0.441 

0.525 

0.623 

0.689 

16 

0.425 

0.507 

0.601 

0.666 

17 

0.412 

0.490 

0.582 

0.645 

18 

0.399 

0.476 

0.564 

0.625 

19 

0.388 

0.462 

0.549 

0.608 

20 

0.377 

0.450 

0.534 

0.591 

21 

0.368 

0.438 

0.521 

0.576 

22 

0.359 

0.428 

0.508 

0.562 

23 

0.351 

0.418 

0.496 

0.549 

24 

0.343 

0.409 

0.485 

0.537 

25 

0.336 

0.400 

0.475 

0.526 

26 

0.329 

0.392 

0.465 

0.515 

27 

0.323 

0.385 

0.456 

0.505 

28 

0.317 

0.377 

0.448 

0.496 

29 

0.311 

0.370 

0.440 

0.487 

30 

0.305 

0.364 

0.432 

0.478 


De “Distribution of Sums of Squares of Rank Differen¬ 
ces for Small Samples”, E. G. Olds, Annals of Mathema¬ 
tical Statistics, Volumen 9 (1938). 
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Apendice 3 Tablas 
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Resumen de Handbook of Tables for Probability and Statistics, Segunda edicion, editado por William H. Beyer (Cleveland: The Chemical Rubber Company, 1968). 






RESPUESTAS 


Capftulo 1 

1.5 a 2.45 -2.65,2.65 -2.85 
b 7/30 
C 16/30 

1.9 a Aprox. .68 
b Aprox. .95 
C Aprox. .815 
d Aprox. 0 

1.13 a y = 9.79; s = 4.14 

b k = 1: (5.65,13.93); k = 2: (1.51, 

18.07); k = 3: (-2.63,22.21) 

1.15 a y = 4.39; = 1.87 

b k = 1: (2.52, 6.26); k = 2: (0.65, 

8.13); k = 3: (-1.22,10) 

1.17 Para el Ejemplo 1.2, rango/4 = 7.35; s =4.14; 
para el Ejemplo 1.3, rango/4 = 3.04; s = 3.17; 
para el Ejemplo 1.4, rango/4 = 2.32, s = 1.87. 

1.19 y-s = -19 <0 


Capftulo 2 

2.7 A = (dos hombres} = {(Mi, M 2 ), 

(Mi ,M 3 ),(M 2 ,M 3 )} 

B = {al menos una mujer} = {(M| ,W i), 
(M 2 ,iy,), (M 3 ,Wi), (Mi,W 2 ), (M 2 ,W 2 ), 

B — {no hay mujeres} = A; A U B = S', 
A PI B = nulo; A D B — A 
2.9 5 = {A + , B + . AB + , 0 + , A". B , 

AB ,CT} 

2.11 a P(E 5 ) = .10; P(E 4 ) = .20 
b p = .2 

2.13 a Ei =muy probablemente (VL); E 2 = 
poco probable (SL); E 3 = 
improbable (U); E 4 = otro (O) 
b No; P(VL) = .24, P(SL) = .24, 
P(U) = .40, P( O) = .12 
C .48 


1.21 .84 
1.23 a 16% 

b Aprox. 95% 

1.25 a 177 

C y =210.8; 5 = 162.17 
d k = 1: (48.6, 373); k = 2: 

(-113.5,535.1); k = 3: (-275.7, 
697.3) 

1.27 68% o 231 puntos; 95% o 323 puntos 
1.29 .05 
1.31 .025 
1.33 (0.5,10.5) 

1.35 a (172 - 108)/4 = 16 
b y = 136.1; s = 17.1 
C a = 136.1 -2(17.1) = 101.9; 
b = 136.1 +2(17.1) = 170.3 


2.15 a .09 
b .19 
2.17 a .08 
b .16 

C .14 
d .84 

2.19 a (V u Vi),(VuV 2 ),(VuV i ), 
(V 2 ,Vi),(V 2 , V 2 ),(V 2 ,V 3 ), 
(V 3 ,Vi),(V 3 , V2),(V 3 ,V 3 ) 

b Es igualmente probable, todos 
tienen probabilidad de 1/9. 

C P(A) = 1/3; P(B) = 5/9; 
P(AUB) = 7/9; 

P(A OS) = 1/9 

2.27 a 5 = {CC, CR, CL, RC, RR, RL, 
LC, LR, LL} 
b 5/9 
c 5/9 


877 



878 Respuestas 


2.29 

2.31 

2.33 

2.35 

2.37 

2.39 

2.41 

2.43 

2.45 

2.49 


2.51 

2.53 

2.55 


2.57 

2.59 

2.61 

2.63 

2.65 

2.67 


2.71 


2.73 


C 1/15 
a 3/5; 1/15 
b 14/15; 2/5 
C 11/16; 3/8; 1/4 
42 

a 6! = 720 
b .5 
a 36 

b 1/6 

9(10) 6 
504 formas 
408,408 
a 8385 
b 18,252 

C Se requieren 8515 
d SI 

a 4/19,600 
b 276/19,600 
C 4140/19,600 
d 15,180/19,600 
a 60 puntos muestrales 
b 36/60 = .6 



20 W 70 \ / / 90 
4 ) ^6 )/ ylO 
(4 X 12)/1326 = .0362 
a .000394 
b .00355 
364" 

a - 

365" 
b .5005 
1/56 
5/162 

a P(A) = .0605 
.001344 
.00029 
1/3 


= .111 


1/5 
C 5/7 

d 1 

e 1/7 
a 3/4 

b 


2.93 

2.95 


.364 
a .1 
b .9 
C .6 


2.97 

2.101 

2.103 

2.105 

2.109 

2.111 

2.113 

2.115 

2.117 

2.119 

2.121 


a .999 
b .9009 
.05 

a .001 
b .000125 
.90 

P(A) >.9833 
.149 

(.98) 3 (.02) 

(•75) 4 

a 4(.5) 4 = .25 
b (.5) 4 = 1/16 
a 1/4 
b 1/3 
a l /n 
. 1 1 


3 

c - 


2.125 

1/12 

2.127 

a .857 


C No; .8696 


d SI 

2.129 

.4 

2.133 

.9412 

2.135 

a .57 


b .18 


2.137 

2.139 

2.141 


2.145 

2.147 

2.149 


c 

2.77 a 

2/3 

.40 

b 

.37 

C .10 

2.151 

2.153 

4[/Ai 

.313 

d 

.67 

e 

.6 

f .33 

2.155 

a .5 

g 

.90 

h 

.27 

i .25 


b .15 


C .3158 
d .90 
a 2/5 
b 3/20 

P(Y = 0) = (,02) 3 ; 

P(Y = 1) = 3(.02) 2 (.98); 
P(Y = 2) = 3(.02)(.98) 2 ; 
P(Y = 3) = (,98) 3 
P(Y = 2) = 1/15; P(Y = 3) 
P(Y =4) =3/15; P(Y =5) 
P(Y = 6) = 5/15 
18! 

.0083 
a .4 

b .6 

C .25 

4[p 4 (l -p) +p{\ -pY] 


C .10 
d .875 


= 2/15; 
= 4/15; 


Respuestas 879 


2.157 .021 

2.161 P(R <3) = 12/66 
2.163 P(A) = 0.9801 
P(B) = .9639 
2.165 .916 

2.167 P(Y = 1) = 35/70 = .5; 

P(Y = 2) = 20/70 = 2/7; 

P(Y = 3) = 10/70; 

P(Y = 4) = 4/70; P(F = 5) = 1 /70 
2.169 a (4!) 3 = 13,824 


2.173 

2.177 

2.179 


b 3456/13,824 = 25 
.25 


a 

b 

c 

a 

b 


.364 

.636 


(49/50)" > .60, y n es a lo sumo 25 
2 oQ^ =.3125 

/P 10 
27 2 . 


Capitulo 3 


3.1 

3.3 

3.5 

3.7 

3.9 


3.11 


3.13 

3.15 


P(Y = 0) 
P(Y = 2) 

M2) = 

p(0) = 2 , 

D 


p(0) = 


= .2, P(y = i) = .7, 
= ,i 

P(3) = ^P(4) = i 

3 1 

P( 1) = 7, Pi 3) = - 

0 0 

6 3 

= — ,p(2) = —, 

27 27 

6 3 18 


P(D = 1 ~ — — = 


a />(E = 
p(y = 
£(y = 
£(y = 

C P(Y > 
P(X =0) 
P( x = 2) 
P(y = o) 
P(Y = 1) 
P(Y = 2) 
P(y = 3) 
P(Z =0) 


27 27 27 

3) = .000125, 

2) = .007125, 

1) = .135375, 

0) = .857375 
1) = .00725 

8 12 

= —,P(X = 1) = —, 
27 27 

6 1 

= —, PCX = 3) = —, 
27 27 

2744 


3375 

588 

3375’ 

14 

3375’ 

1 


,Z = X + Y, 


3375 

27 54 

= - ,P(Z = 1) = -, 

125 125 

36 8 

P(Z = 2) = -, P(Z = 3) = - 

125 125 

1,7 27 

£00 = - ,E(Y 2 ) = -, V(y) = —, 

4 4 10 


costo = 


a P(y = 0) = .1106, 
PCY = 1) = .3594, 
P(Y = 2) = .3894, 


C P(Y = 1) = .3594 
d (jl = £(F) = 1.56, o- 2 = .7488, 
a = 0.8653 
e (-.1706,3.2906), 

P(o < y <3) = i 

3.17 /x = E(Y) = .889, 

o-z = y (Y ) = E{Y 2 )-[E{Y)f = .321 
tj — 0.567, (/x — 2a, 
fi+2 a) = (-.245,2.023), 

P(0 < Y < 2) = 1 

3.19 C = $85 

3.21 13,800.388 

3.23 $.31 

3.25 Firma I: E(utilidad) = $60,000 
E(utilidad total) = $120,000 

3.27 $510 

3.35 .4; .3999 

3.39 a .1536; 
b .9728 

3.41 .000 

3.43 a .1681 
b .5282 

3.45 /’(funciones de alarma) = 0.992 

3.49 a .151 
b .302 

3.51 a .51775 
b .4914 

3.53 a .0156 
b .4219 
C 25% 
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3.57 

3.59 

3.61 


3.67 

3.69 

3.73 

3.75 

3.81 

3.83 

3.87 

3.91 

3.93 

3.95 

3.97 


3.99 

3.101 


3.103 

3.105 

3.107 

3.109 

3.111 


$185,000 
$840 
a .672 
b .672 
C 8 
.07203 

Y es geometrica con p = .59 


a 

b 

a 

b 

2 

1 

n 


.009 

.01 

.081 

.81 

n — 1 


E - = - 


pln(p) 


YJ 1-p 
$150; 4500 
a .04374 
b .99144 


.1 

a 

b 

c 


.128 

.049 

p = 15, cr 2 = 60 
7! 


y+i- 


p(x) = - p r q 

(r — 1)!(_y -r + 1 )! 
y = r — 1, r, r + 1,... 

5 

a IT 

b ^ 

yo 

1 

42 

b .7143 
C p = 1.875, 
a = .7087 

hipergeometrica con N = 6, n = 2, 
y r= 4. 


.0238 
.9762 
.9762 
p{0) = 

p{ 2) = 


9 1 

p{ 2) = —, p(3) = — 

F 30 30 

3.113 / > (y<l)=.187 

3.115 p(0) = i,p(l) = |,/»(2) = i 

3.117 a />(/ =0) = .553 

b £(T) = 9.5, V(T) = 28.755, 
a = 5.362 
3.119 .016 
3.121 a .090 
b .143 
C .857 
d .241 
3.123 .1839 

3.125 E(S) = 7, V(S) = 700; no 

3.127 .6288 

3.129 23 segundos 

3.131 .5578 

3.133 .1745 

3.135 .9524 

3.137 .1512 

3.139 40 

3.141 $1300 

3.149 Binomial, n = 3 y p = .6 

3.151 Binomial, n = 10 y p = .7, 
P(Y <5) = .1503 

3.153 a Binomial, n = 5 y p = .1 

, 1 

D Geometrica, p = - 
2 

C Poisson, A = 2 


3.155 a E(Y) = 
b V{Y) = 


3.167 

3.169 


1 2 3 

Pi 1) = g,p(2) = ~,P( 3) = - 

.64 

C = 10 

p(-l) = 1/(2A 2 ), 

p(0) = 1 -(1/A 2 ),p(l) = 1(2 A 2 ) 


14 

—, p(l) = 
30 

14 

30’ 

3.171 

(85, 115) 

2 

3.173 

a P { 0) = 

30 

5 

15 


P(3) = 

30’ i;l(1) ~ 

30’ 


C E(Y) 


a = .866 





Respuestas 881 


3.175 

a 

38.4 


3.195 

a 

.982 



b 

5.11 



b 

P(W > 1) 

= 1 — e 

3.177 

(61.03,98.97) 


3.197 

a 

.9997 





1 


b 

n — 2 


3.179 

No. P(Y >350) < 

„ - .1126. 








(2.98) 2 

3.199 

a 

.300 


3.181 





b 

.037 


P = 

Fraccion defectuosa /’(aceptacion) 

3.201 

(18.35, 181.65) 

a 

b 


U 

.10 

1 

.5905 

3.203 

a 

E[Y(t)] = 

k{e lx ‘ - 






b 

3.2974. 2.139 

c 


.30 

.1681 





d 


.50 

.0312 

3.205 

.00722 


e 


1.0 

0 

3.207 

a 

p(2) = .084, P(Y 






b 

P(Y > 10) = .014 

3.185 

a 

.2277 







b 

No improbable 


3.209 

.0837 


3.187 

a 

.023 


3.211 

3 




b 

1.2 


3.213 

a 

.1192 



c 

$1.25 



b 

.117 


3.189 

1 

— ( 99999 ) 10,000 


3.215 

a 

n[ 1 +k(l 

~ .95*)] 

3.191 

vm = .4 



b 

g(k) se minimiza ei 







J?(5) = .4262. 

3.193 

.476 



c 

,57381V 



Capitulo 4 






4.7 

a 

P(i < 5) = 

0.591, 


d 

.75 




P(2 < Y < 5) = 

.289, y 


e 

.75 




no es igual 





f° 


b 

P(2 <5) = 

0.618, 




y 2 



P(2 < Y <5) = 

0.316, y 

4.13 

a 

II 

> 

T , 



no es igual 





1 


c 

Y no es una variable aleatoria 




31 2 



continua, de modo que no 




L 1 



se cumplen los resultados anteriores 


b 

.125 


4.9 

a 

Y es una variable aleatoria discreta 


c 

.575 



b 

Estos valores son 2, 2.5, 4, 5.5, 6 , 

4.15 

a 

Para b > 

o, f(y) 



y 7. 




I f(y) 

= l 


■2) = .125 


y < 0 

0 <y < 1 

1 < y < 1.5 
y > 1.5 


p (2 ) = = 1, 


q 


P( 4) = 4,P( 5.5) 

lo 

P( 6 ) = ^,/»(7) = 

</>.5 = 4 
1 

c = - 
2 


_ 1 

” 8’ 
5 

16 


b 

y’ 

0 en otra parte. 
b 


, b 

D F(y) = 1 — — ,paray 


b F(y) = ^-,0 <y <2 


(b + c) 
. (b +c) 

(b + d ) 
3 

a c — — 


3 2 

b F(y) = , para 0 < y 


4.11 


4.17 
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d £(-l) = 0, £(0) = 0, £(1) = 1 
3 

C 16 
f 104 

123 

'0 y <0 

,, , .125 0<y <2 

3 .125y 2 <y <4 

.0 y > 4 


13 


4.21 

£(y) = 

.708, v(y) = 

.0487 

4.25 

£(y) = 

31/12, V(Y) = 

= 1.160 

4.27 

$4.65, .012 


4.29 

£(y) = 

60 , v(y) = - 


4.31 

E(Y) = 

4 3 


4.33 

a £(y; 

1 =5.5, V(y) = 

= .15 


b Usando el teorema de Tchebysheff, 


el intervalo es (5, 6.275). 


C SI; P(y) = .5781 
4.37 £(y)=0 
4.39 .5; .25 

2 

4.45 a P(Y < 22) = - = .4 

b £(y > 24) = ^ = .2 

3 

4.47 a P(Y >2) = - 

b Co + ci - + 9 

4.49 - 

4 


1 

c - 
4 

4.55 a - 

, 7 

b /X = .015, V(y) = .00041 
4.57 £ (^ £)3 ) = -000006577, 

V (^£> 3 ) = .000352577 2 

4.59 a zo = 0 



b 

Zo = 1.10 


c 

zo = 1.645 


d 

zo = 2.576 

4.63 

a 

P(Z > 1) = .1587 


b 

Se obtiene la misma respuesta. 

4.65 

$425.60 

4.67 


= 3.000 in. 

4.69 

.2660 

4.71 

a 

.9544 


b 

.8297 

4.73 

a 

.406 


b 

960.5 mm 

4.75 

P 

= 7.301 

4.77 

a 

0.758 


b 

22.2 

4.87 

a 

$05 = .70369. 


b 

$05 = .35185 

4.89 

a 

(8 = .8 


b 

P(Y < 1.7) = .8806 

4.91 

a 

.1353 


b 

460.52 cfs 

4.93 

a 

.5057 


b 

1936 

4.97 

.3679 

4.99 

a 

.7358 

4.101 

a 

£(y) = 1.92 


b 

P(Y >3) = .21036 


d 

P(2 < y < 3) = .12943 

4.103 

£(A) = 200tt, V (A) = 200,0007T 2 

4.105 

a 

E(Y) = 3.2, V(Y) = 6.4 


b 

P(Y > 4) = .28955 

4.107 

a 

(0, 9.657), porque y debe 



ser positiva. 


b 

£(y < 9.657) = .95338 

4.109 

£(L) = 276, V(£) = 47,664 

4.111 

d 

VPY (a + -j/r(a)sioi>0 


1 . ^ r(«-i) 

e - si o: > 1, ——-— 

P(a ~ 1 ) VPF(a) 

1 1 


ai u ^ ~ ~ — 

2 /3 2 (a - l)(a -2) 
si a > 2 

4.123 a it = 60 

b $ 95 = 0.84684 

4.125 £(y) = V(y) = ^ 

4.129 £(C) = y, V(C) = 29.96 

4.131 a .75 

b .2357 

4.133 a c = 105 
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8 


C a = .1614 
d .02972 

4.139 m x {t ) = exp{/(4 — 3/jl) +(l/2)(9cr 2 ? 2 )} 
normal, E{X) =4-3/u,, V(X) = 9o- 2 , 
unicidad de funciones de generacion 
de momenta 


4.141 

4.143 

4.145 


4.147 

4.149 

4.151 


4.153 

4.155 

4.157 


4.159 


m(t) = 

a[3, afi 2 
2 


tie 2-fli) 


(r + 1) 


c 1 

1 

cr = - 
2 

1 

El valor de 2000 es .53 desviacion 
estandar sobre la media. Asf, 
esperarfamos que C rebase 2000 con 
frecuencia. 

(6.38, 28.28) 

$113.33 


x < 0 


b 

a 



4.161 

4.163 

4.165 


0 y < 0 

4y 2 /3 0<y<.5 

{Ay — l)/3 .5<y<l 
1 y > I 

b F(y) = 0.25 Fj(y) + 0.75 F 2 (y) 
C £(K) = .533, V(Y) = .076 
<pg = 85.36 
1 — (.927) 5 = .3155 
a c = 4 

b £(y) = i, v(y) = .5 


C m(t) = 


1 


(1 — .5r) 2 


/ <2 


4.167 

4.169 

4.171 

4.173 

4.175 

4.179 

4.181 

4.183 


0 < X < 200 

4.187 

a e~ 2S ■ 

x >200 


b .0186 


4.189 

E{Y) = ( 



V(Y) = . 

y < 0 




4.191 

c 1 — e 

0 <y <5; 

4.193 

150 

IV 

Lfx 

4.195 

a 12 


= r(a+fi)r(k+a) 

V(a)T(k +a + j 8 ) 
e " 2 - 5 = .082 

a E{W) = -, V(W) = - 
2 4 

b 1 - e “ 6 

/(r) = 2\Tr re~ k ' ,TI ~, r > 0 
V5 = 1.414 
k = (,4 ) 1/3 = .7368 
m{t) — exp(f 2 / 2 ); 0 ; 1 
a E{Y) = 598.74 g 

V(y) = e 22 (e 16 - 1)10 “ 4 

b (0,3,570,236.1) 

C .8020 

= .082 


n — 1 


b w = 120 


Capi'tulo 5 


5.1 a 


,V2 


1 


yi 

l 


5.3 


b F(1,0) = - 

4 ) f 3 )( 3 2 

y\ \yi v 3 ~y\~yi 


(*\ 


,donde 


5.5 

5.7 

5.9 


0 £ yi, o < y 2 , y yi + y 2 — 3. 


.1065 

.5 

.00426 
.8009 
k = 6 
31 

64 

29 


5.11 a — 

32 

, 1 
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5.13 

5.15 

5.17 

5.19 

5.21 


a 

b 

c 

a 

b 

c 



.65625 
e -1 - 2e~ 2 

1 



.50 


9 

16 

13 

16 


,Vl 


Pi(yi) 


b No 

a Hipergeometrica con N = 9, 
n = 3, y r = 4. 

b I 


8 

c — 

15 3 3 

5.23 a / 2 (y 2 ) = - - -yf, 0 < y 2 < 1 

b Definida sobre y 2 £ y\ £ 1 si y 2 £ 0 
1 

C 3 

5.25 a fi(yi) = e n , yi > 0; 
f 2 (y 2 ) = e~ yl , y 2 >0 
b P(1 < Yi <2.5) = P(1 < Y 2 < 
2.5) = e~ l - e~ 2 - 5 = .2858 

C y 2 > 0 

d f(yi\yi) = fi(yi) = e~ yi , yi > 0 
e fiyi |yi) = h(y 2 ) = e~ yi , y 2 > o 

f igual 
g igual 

5.27 a /i(yi) = 3(1 -yi) 2 ,0 <yi < 1; 

f 2 (y 2 ) = 6 v 2 (l - y 2 ), 0 < y 2 < 1 


C f(y i|y 2 ) = —, 0 < y x < y 2 , 

, y2 

si y 2 < 1 

^ r , i , 2(1 — y 2 ) 

d 

< y 2 £ 1 si yi a 0 

e - 

4 

5.29 a / 2 (y 2 ) = 2(1 - y 2 ), 0 < y 2 < I; 
/l(yi) = 1 - I yi|, para 

-1 < ji < 1 

b - 

3 

5.31 a /i(yi) =20yi(l - Vi) 2 , 0< 
yi £ 1 


5.33 


5.35 

5.37 

5.41 

5.45 

5.47 

5.51 


5.53 

5.55 

5.57 

5.59 

5.61 

5.63 

5.65 

5.69 


5.71 


5.73 

5.75 


5.77 


b f 2 (y 2 ) — 

( 15(1 + y 2 ) 2 y\, -1 £ y 2 < 0 

i 15(1 ~y 2 ) 2 yl, 0<y 2 <l 

c /(y 2 |yi) = §y 2 (i -yi)“ 3 , 

para y 1 - 1 < y 2 < 1 — y, 
d .5 

a /i(yi) = yi6 V1 , yi — 0 ; 

f 2 {y 2 ) = e~ yi , y 2 >0 
b /(yi|y 2 ) = e~ (n ~ y2 \ y x > y 2 
c /(y 2 |yi) = 1/yi, 0 syj <yi 
.5 
e~ l 
1 

4 

No 

Dependiente 

a f(yu y 2 ) = /i(.Vi)/ 2 (y 2 ) de modo que 
Yi y Y 2 son independientes. 
b Si, las probabilidades condicionales 
son iguales que las probabilidades 
marginales. 

No, son dependientes. 

No, son dependientes. 

No, son dependientes. 

No, son dependientes. 

Si, son independientes. 

1 

4 

Exponencial, media 1 

a f(y i, y 2 ) = e~^ +y ^\ 

yi > 0 , y 2 > 0 
b P(Yi +Y 2 < 1 ) = 

1 - -e~ 1/3 = .0446 
1 3 



144 


4 

3 

a 2 

b .0249 
C .0249 

d 2 


e 

a 

b 


c 


Son iguales. 

1 1 

4’ 2 

E(Y 2 ) = 1/10, V(Y,) 
E(Y 2 ) = 1 V(Y 2 ) = 

4 






Respuestas 885 


5.79 

5.81 

5.83 

5.85 


5.87 

5.89 

5.91 

5.93 


5.95 


5.97 


5.99 

5.101 

5.103 

5.105 

5.107 

5.109 

5.111 


0 

1 

1 

a 


5.115 b V(y) = 38.99 

C El intervalo esl4 .7 ± 2V38.99 o bien 
(0, 27.188) 


E(Y X ) = E(Y 2 ) = 1 (ambas 
distribuciones marginales son 
exponenciales con media 1) 
V(F,) = V(Y 2 ) = 1 
E(Y l -Y 2 ) =0^ 

E{Y l Y 2 ) = 1 - “,asf 

Cov(Ei, Y 2 ) = -J 


5.117 


5.119 


Pi ~ P2, 
N-n 

n(N - 1) 
.0823 


[pi + P2 - (pi - P2) 2 ] 


a a 

-Y + * V 2+ 2 

a E(Y\ + Y 2 ) — vi + v 2 
b V{Yi + Ft) = 2vi + 2v 2 
. 2 

Cov(F 1i F 2 ) = —Cuando aumenta 
el valor de Fi el de Y 2 tiende a 
disminuir. 

Cov(Fi,y 2 ) = 0 

a 0 

b Dependiente 
C 0 


5.121 

5.123 

5.125 

5.127 

5.133 


, „ n , , 2 n 

E(Y 1 ) = V(Yi) = — 

Co V (y 2 , y 3 ) = 


2 n 


E(Y 2 - y 3 ) = 0 , y(y 2 - y 3 ) = — 

.0972 
.2; .072 


.08953 


a 
b 
a 
b 

a — 


.046 

.2262 

.2759 

.8031 

F 2 

2 

1 

4 


d No necesariamente independiente 

5.135 

3 

a - 

Las distribuciones 



2 

marginales para Fi y Y 2 son 



b 1.25 

3 



5.137 


% 

1 

O 

to 

0 

1 


8 

111 2 

1 

5.139 

a naf} 

Pl( 7 l) j 3 : P2 ^ 2 ^ 3 

3 


b A ap 

Cov(Fi, y 2 ) = 0 


5.141 

, A 

£<« - 

a 2 


5.143 

m u(t) = (1 

b Imposible 



V(U) = 1 

C 4 (una asociacion lineal 


5.145 

1 

positiva perfecta) 



3 

d —4 una asociacion lineal 


5.147 

11 

negativa perfecta) 

0 


5.149 

36 

a f{y 1 ) = 


2A 2 


a 

a -- 
4 

£(3F! +4y 2 -6F 3 ) = -22, 
y(3Fi + 4F 2 — 6F 3 ) =480 


£(y! + y 2 ) = 2/3 y 

y(y 1 + y 2 ) = — s.is 7 

(11.48, 52.68) 

E{G) = 42, V(G) = 25; el valor $70 es 
70-42 

- = 7.2 desviaciones estandar 

5 5.161 

arriba de la media, un valor improbable. 


f(y 2 ) = 2 ^ “Ft)- 0 -72 ^ 1 


b - 


271 


(i-y 2 2 ) 


72 — 7i — 1 


23 
44 

c /(7i 1 72) = 

d — 

12 

P( 7 ) = 
y + a — 1 

y 

7 = 0 , 1 , 2 , 

£(y - Z) = - M2 , v(y -1) = 

a 2 /n + (T 2 / 


p + iy VP + 1 
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5.163 b F(y u y 2 ) = 

yiy 2 [l -a(l Vi )(1 -y 2 )] 

c f(y i, y 2 ) = 

1 -a[(l - 2 yi )(l -2y 2 )], 

0 < yi < 1 , 0 < y 2 < 1 


d Seleccione dos valores diferentes para a 
con — 1 < a < 1 . 

5.165 a (pie' 1 + p 2 e' 2 + p^e’ 2 )" 
b m(t, 0 , 0 ) 

C Cov(Xi ; X 2 ) = ~npip 2 


Capi'tulo 6 


6.1 a 
b 


1 — u 


2 

u + 1 


2 

1 


-1 < u < 1 

-1 < 1 


6.29 



c 

— - 1, 0 < 1 
yu 

6.31 


d 

E(Ui) = ~l/3, E(U 2 ) = 



1/3, E(U 3 ) = 1/6 

6.33 


e 

£(2L — 1) = -1/3, £(1-2L) = 
1/3, E(Y 2 ) = 1/6 

6.35 

6.3 

b 

's'' 

II 

6.37 



f {u + 4) /100, -4<m<6 

jl/10, 6 < t< < 11 

6.39 

6.5 

C 5.5833 

. , 1 (u — 3\ -1/2 

fu( u ) 16 ( 2 ) ’ 

6.43 


6.7 a fu(u) = u 1/2 e 7 , 

v7a/2 

m S: 0 


6.9 

6.11 


6.13 

6.15 

6.17 


6.25 

6.27 


b [/ tiene una distribucion gamma con 
a = l/2y/3=2 (recuerde que 

r ( i /2) =v£). 

a /c/( M ) = 2u, 0 < u < 1 
b E(U) = 2/3 
C £(Ki + y 2 ) = 2/3 
a fu(u) = 4ue _2 “, «£0, unadensidad 
gamma con a — 2 


y P — 1/2 

b E(U) = 1, V(£7) = 1/2 

/{/(“) = F u( u ) = ^5 e ~ U/li ’ u>0 

[—ln(l - (7 )] 172 
av “ _1 

a /(y) = 

b y = du i/a 

C y — A\fu. Los valores son 2.0785, 
3.229, 1.5036, 1.5610, 2.403. 
fv(u) = 4 ue~ 2u para u S 0 


a fr(y) ~ — we w2 ^,w > 0 , que es 


densidad Weibull con m = 2. 
b E(Y k/2 ) = T + 1^ /3 k/2 


6.45 

6.47 

6.51 


6.53 


6.55 

6.65 


a fwM = 

1 


r (§) ar)V 2 

b E(W) = ^kT 

fuM = ,. ~ « 


w 1/2 e~ wlkT 


- 0 


(1 +u ) 3 
/(/(«) = 4(80 — 31m +3u 2 ), 
4.5 <5 


w > 0 


fu(u ) = — ln(«), 0 £ u £ l 
a m Yl {t) = 1 — p + pe ' 
b m w {t) = £(e' 1 *') = [ 1 —p + pe']" 
fu{u) = 4i/e _2 “, «20 
a ? tiene una distribucion normal 
con media /r y varianza a- 2 In 
b P(|y-/u|<l) =.7888 
C Las probabilidades son .8664, .9544, 
.9756. Por lo tanto, cuando aumenta 
el tamano muestral, aumenta la 
probabilidad de que P(|? — p,| £ 1 ) 
c = $190.27 
P(U > 16.0128) = .025 
La distribucion de Y[ + (n 2 — Y 2 ) es 
binomial con n i + n 2 intentos y probabilidad 
de exito p = .2 
a Binomial ( nm , p) donde 


n, = in 

b Binomial («i = n 2 + ... n„, p) 
C Hipergeometrico (r = n, 

N — ni + n 2 + ... n„) 

P(Y >20) = .077 
a f{,u i , ui) — 

— p [“l + ("2-“l) 2 ]/2 = 

2p 

—(2«j—2 «iU2+“2)/2 

2 p 

b E(Ul) = £(Zi) = 0, 

E{U 2 ) = E(Zi + Z 2 ) = 0, 

v(uo = v(Zj) = 1 , 

V(U 2 ) = V(Zi + z 2 ) = 

V(Z0 + V(Z 2 ) = 2, 

Cov(t/i, l/ 2 ) = E(Zj) = 1 
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6.81 

6.83 

6.85 


No independiente porque 

Pf 0 . 

Esta es la distribution normal 
bivariada con jX\ = /xi = 0 , 
of = l,(r , 2 = 2 ,yp = 


1 


1 

V2 


6.69 a f(y u y 2 ) = 2 2 ’ > !. 

ym 

y 2 > 1 

e No 

a #( 2 )(m) = 2m, 0 £ u £ 1 
b E(U 2 ) = 2/3, V(C/ 2 ) = 1/18 


6.89 
6.93 

6.95 a /;/, (m) = 


6.73 

6.75 

6.77 


(10/15) 5 

a 


n ! 


(/ - 1 )!(* “ 1 -/)!(« “*)! 

n—A: 


yj ‘[y*-[»-»]" 

d" 

0 <yj <y k < 6 
u (n~k + 1 )j 2 
(n + l) 2 (u +2) 

(» ~ k + j + 1 )(k - j) 2 
(n + 1 ) 2 (n +2) 
b l-e “ 9 
1 - (.5)" 

.5 


f R (r)=n(n-iy- 2 (l-r), 

0 <r < 1 

/( w )= K ^“ w ) ,0£w£1 

' 1 

- 0 <M < 1 

2 

1 

—- u > 1 

, 2m 2 

b fu 2 ( u ) = 0 £ m 

C Igual que el Ej. 6.35. 

6.97 p(W = 0) = p(0) = .0512, 
p( 1) = .2048, p{ 2) = .3264, 
p(3) = .2656, p(4) = .1186, 
p(5) = .0294, p{ 6 ) = .0038, 
p(7) = .0002 

6.101 fu{u) = 1, 0 £ m £ 1 Por lo tanto, U tiene 
una distribution uniforme en ( 0 , 1 ) 

6.103 —--—=-,oo < Ml <oo 

tt(1 + m?) 

6.105 1 - m)“~ 1 ,0<m < 1 


£(«. /3) 

6.107 /;;(«) = 


1 

4\/m 

1 

8\/m 


0 < m < 1 


1 <M <9 


6.87 

a g(p(y) = e <- y 4) ,y >4 
b £(7(i)) = 5 

Capitulo 7 

6.109 

P(U = Ci -C 3 ) = .4156; 

P(U =C 2 - C 3 ) = .5844 

7.9 

a .7698 

b Para n = 25, 36, 69, y 64, las 

probabilidades son (respectivamente) 

7.31 

a 5.99, 4.89, 4.02, 3.65, 3.48, 3.32 

C 13.2767 
d 13.2767/3.32 = 4 


.8664, .9284, .9642, .9836. 

C Las probabilidades aumentan conn, 
d SI 

7.35 

a E{F) = 1.029 
b V(F) = .076 

C 3 esta 7.15 desviaciones estandar 

7.11 

.8664 


arriba de esta media; valor improbable. 

7.13 

.9876 

7.39 

a normal, E(d) — 6 = 

7.15 

a E(X - ?) = mi “ 
b V(X — Y) = of/ m + of / n 

C Los dos tamanos muestrales deberfan 
ser al menos 18. 


c lpl + C 2 /J -2 +-b c k p, k 

V{6) = + • • ■ + — ^io- 2 

\ ,! 1 n 2 n k/ 

b x 2 con n i + n 2 + • ■ • + — A; gl 

7.17 

p(T,U z , 2 - 6 ) =-57681 


C t con ni + n 2 + ■ ■ ■ + n k ~ k gl 

7.19 

P(S 2 >.065) = .10 

7.43 

.9544 

7.21 

a b = 2.42 

7.45 

.0548 


b a — .656 

7.47 

153 


c .95 

7.49 

.0217 

7.27 

a .17271 

7.51 

664 


b .23041 

7.53 

b Y es aproximadamente normal: .0132. 


d .40312 

7.55 

a muestra aleatoria; aproximadamente 1 . 
b .1271 
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7.57 .0062 
7.59 .0062 
7.61 n = 51 
7.63 56 clientes 

7.65 a Exacta: .91854; aproximacion 
normal: .86396. 

7.67 a n — 5 (exacta: .99968; 

aproximada: .95319); n = 10 
(exacta: .99363; aproximada: 
.97312); n = 15 (exacta: .98194; 


b Conp = .2 y .3, las 

probabilidades son .0559 y.0017 
respectivamente. 

7.83 a .36897 
b .48679 
7.85 .8414 
7.87 .0041 
7.89 /jl = 10.15 

7.91 CornoX, Y, y W estan normalmente 
distribuidas, as! estan X, Y, y W. 


aproximada: .97613); n = 20 
(exacta: .96786; aproximada: 
.96886) 

7.71 a n > 9 

b n > 14, n > 14, n > 36, n > 36, 
n > 891, n > 8991 


7.73 

.8980 


7.75 

.7698 

7.95 

7.77 

61 clientes 


7.79 

a Usando la aproximacion normal: 



.7486. 

7.97 


b Usando la probabilidad 

7.101 


binomial exacta: .729. 

7.103 

7.81 

a .5948 

7.105 


Capitulo 8 


8.3 

a B(6) = ad + b — d = (a — 1)8 + b 

8.31 


b Sea 6* = (6 — b)/a 

8.33 

8.5 

a MSE((9*) = V(8 *) = V(8)/a 2 

8.35 

8.7 

cr 2 — c 

a = —z -±- 

of + oj — 2c 

8.37 

8.9 

Y - 1 

8.39 

8.11 

(?3 - 902 + 54 


8.13 

b [n 2 /( n — l)](17n)[l " (E/n)] 

8.41 


8.15 a 


P-u = E(U) = -4/x 1 +.2/j. 2 +A^ 



a F con numerador. gl = 1, denominador. gl = 9 

b F con numerador. gl = 9, denominador. gl = 1 

C c = 49.04 

b .1587 

.8413 

.1587 

.264 


a -.03 ± .041 
.7 ± .205 
a 20 ±1.265 
b -3 ± 1.855, si 
1020 ±645.1 

2 Y 2 Y \ 

9.48773’ .71072 ) 
a (Y 2 / 5.02389, Y 2 /. 0009821) 
b K 2 /. 0039321 
C F 2 /3.84146 


8.17 


8.19 

8.21 

8.23 


8.25 

8.27 

8.29 


b 

a 

b 


MSEQ 8 ) = --- 

( 3 n - 1 )( 3 n - 2 ) 
(1 -2 p)/(n + 2 ) 
np(l -p) +(1 - 2 p ) 2 
(n + 2) 2 




C p sera cercana a .5. 
MSE(O) = f) 2 
11.5 ± .99 
a 11.3 ±1.54 
b 1.3 ±1.7 
C .17 ±.08 
a -.7 
b .404 
a .601 ±.031 


a -.06 ±.045 


8.43 b [K(„,](.95)- 1/ " 

8.45 a 17.05132 
b 80% 

8.47 c (2.557,11.864) 

8.49 c (3.108,6.785) 

8.57 .51 ±.04 
8.59 a .78 ±.021 
8.61 (15.46,36.94) 

8.63 a .78 ± .026 o (.754, .806) 
8.65 a .06 ± .117 o (—.057, .177) 
8.67 a 7.2 ±.751 
b 2.5 ± .738 

8.69 .22 ±.34 o (-.12, .56) 

8.71 n = 100 
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8.73 

8.75 

8.77 

8.79 

8.81 

8.83 

8.85 

8.87 

8.91 

8.93 


8.95 

8.99 


8.101 


9.1 

9.3 

9.5 

9.7 

9.9 

9.23 

9.25 

9.31 

9.35 


9.47 

9.57 

9.59 

9.61 

9.63 

9.69 


n = 2847 
n = 136 
n = 497 
a n = 2998 
b n = 1618 
60.8 ± 5.701 
a 3.4 ±3.7 
b .7 ±3.32 
-1 ±4.72 


(-.624,.122) 

(-84.39, -28.93) 

- - [i 3~ 

a 2 X + Y ± 1.96 a. - + - 
V n m 

. - - /4 3“ 

b 2X + Y ± t a / 2 SJ— + —, donde 
V n m 

sl = Z(Y, ~ Y) 2 + 1/3 E(X,- - X ) 2 
n + m — 2 

(.227, 2.196) 


a 

b 



= .0286; (.013, .125) 


8.103 

8.105 

8.107 

8.109 

8.111 

8.113 

8.115 

8.117 

8.119 

8.121 

8.123 

8.125 


8.129 

8.131 

8.133 


(1.407, 31.264); no 
1 - 2(.0207) = .9586 
765 semillas 
a .0625 ± .0237 
b 563 
n = 38,416 
n = 768 


(29.30, 391.15) 
11.3 ± 1.44 
3 ± 3.63 
-.75 ± .77 
.832 ±.015 


a -4 x -4 




s 2 

o 2 


Ol f 1 1 

^1 r V2,vi,a/2 


v, = — 1 , i = 1 

2{n — l)cr 4 


S 2 

f -2 ri , l , v 2> a / 2 
2 


1 


n + 1 
2a- 4 

n 1 + n 2 — 2 


Capitulo 9 

1/3; 2/3; 3/5 

b 


12 n 2 


(n + 2){n + l ) 2 
n — 1 
l/n 

a X 6 = l 

C necesita Var (X 2 i — 2/ 2 i-i) < 00 

b .6826 

C No 
afi 

a Y„ es insesgada para /a. 

b = i E"=, °: 2 


i=l 

Si 


ft + 1 


ft z 

no 


b 

6 = 


n 

3ft + 1 
3 n 


9.71 (7 2 = m' = - Y" Y 2 

9.75 Con m 2 = - 'y l 7 , 2 , el estimador MOM de 


0es0 = 


n 

1 - 2 m ( 


9.77 -? 

3 

9.81 
9.83 


2 . 
-1 
3 

f 2 


9.85 


$ = j “ !) 

0 = -y 

a 

E(6) = e, Vie) = 6 2 /{na) 



d y =l Yi 

/ 1 M 


( 1_ J 

c 

V 31.4104 ’ 


9.87 p A = .30, p B = 

y (») 

p c = .32;-.08: 


9.91 y w /2 

-I’m 

9.93 a y ( i) 

1 

C [(oj/2) 1 ^ 2 "3 / (i ) 

—, no, no es MVUE 9.97 a 1 /K 


10.8508 


b i/y 
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9.99 

9.101 

9.103 


P ± Za/2 


P(1 ~ P) 


exp(-y) — Za/2 

1 " 


?exp(-2K) 

n 


9.105 

9.107 

9.109 

9.111 


S(K, - /x ) 2 


exp(-//K)_ 
a N, =27-1 


b 


v 2 -1 


3 n 

252 ±85.193 


Capitulo 10 

10.3 a c = 11 

b .596 
C .057 

10.5 c = 1.684 
10.7 a Falso 
b Falso 
C Verdadero 
d Verdadero 
e Falso 

f i Verdadero 

ii Verdadero 

iii Falso 

10.17 a H 0 : p.i = p. 2 > H a \ Pi > Po. 

C z = .075 

10.21 z = 3.65, rechazar H 0 
10.23 a-b H 0 : /j,i — p , 2 = 0 vs. 

//„: p-i — p 2 / 0 , que es una 
pmeba de dos colas. 

C z — —.954, que no lleva 
a un rechazo 
con a = . 10 . 

10.25 Izl = 1.105, no rechazar 
10.27 z = —. 1202 , no rechazar 
10.29 z = 4.47 
10.33 z = 1.50, no 
10.35 z = —1.48 (1 = sin hogar), no 
10.37 aprox. 0 (.0000317) 

10.39 .6700 
10.41 .025 
10.43 a .49 
b .1056 

10.45 .22 ±. 155 o (.065, .375) 

10.47 .5148 
10.49 129.146, sf 
10.51 z = 1.58 valor p = .1142, no 
rechazar 

10.53 a z = -.996, valor p =.0618 
b No 

C z = -1.826, valor p = .0336 

d SI 

10.55 z = —1.538; valorp = .0616; no 
rechazar H 0 con a = .01 


10.57 z = -1.732; valorp = .0836 
10.63 a t = —1.341, no rechazar Ho 
10.65 a t = —3.24, valorp < .005, sf 
b Usando la aplicacion, .00241 
C 39.556 ±3.55 

10.67 a t = 4.568 y t m = 2.821 de modo que 
rechace H 0 . 

b El Finite inferior de confianza de 99% 
es 358- 2.821 -^L = 309.83. 

VIo 

10.69 a t = -1.57, .10 < valor p < .20, 
no rechazar; usando aplicacion, 
valor p — .13008 

i -f 10 = -1.319 y 

f 05 = -1-714; 

. 10 < valor p < . 20 . 

ii Usando la aplicacion, 

2 P(T < -1.57) = 

2(. 06504) = .13008. 


10.71 a y, = 97.856, sf = .3403, 
y 2 = 98.489, if = .3011, 
t = -2.3724, i oi = -2.583, 

—f 0 25 = — 2 . 12 , asf .02 < valor p 
< .05 

b Usando la aplicacion, .03054 
10.73 a t = 1.92, no rechazar 

.05 < valor p < .10; valor p de 
aplicacion = .07084 
b t = .365, no rechazar valor p 

> .20; valorp de aplicacion = .71936 
10.75 t = —.647, no rechazar 
10.77 a t = —5.54, rechazar, valorp < .01; 
valor p aprox. de aplicacion 
b Sf 

C t = 1.56, .10 < valorp < .20; 

valor p de aplicacion = . 12999 
d Sf 

10.79 a x 2 = 12 . 6 , no rechazar 
b .05 < valorp < .10 
C Valorp de aplicacion = .08248 
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10.83 

10.85 

10.89 

10.91 

10.93 

10.95 

10.97 

10.99 


10.101 

10.103 

10.107 


a of ^ of 
b of < of 
c of > of 

X 2 = 22.45, valor p < .005; 
valor p de aplicacion = .0001 
a .15 
b .45 
C .75 
d 1 

a Rechazar si Y > 7.82. 
b .2611, .6406, .9131, .9909 


/? = 16 

a U = j| £? =1 ^ tiene X( 2 24) 

distribucion bajo // 0 : rechazar H 0 

s i U >xl 

b SI 

d Sf, esUMP 

n 

a J2 Yi ~ k 

1=1 

b Use tabla de Poisson para hallar k 
tal que P(£ b, — k) ~ a 
C Sf 


a J2 Y ' <C 
1=1 
b Sf 

a Rechazar H 0 si F(„) £ 0oV“ 
b SI 


2 _(n- l)Sf + (m - 1)S 2 
X 2 

, - 0 - 
X(„+ m - 2 ) distribucion bajo H 0 ; 

rechazar si x 2 > xf 


tiene 


10.109 a X = 




v i i/ \ wi "bn 

rnA + «r 


10.115 


10.117 


10.119 

10.121 

10.123 

10.125 

10.127 

K 


m + n 

b X/Y distribuida como F con 2 m y 
2/2 grados de libertad 
a Verdadero 
b Falso 
C Falso 
d Verdadero 
e Falso 
f Falso 
g Falso 
h Falso 
i Verdadero 

at — —22.17, valor// < .01 
b -.0105 ± .001 
c Sf 
d No 

a H 0 : p = .20, H a : p > .20 
b a = .0749 
z = 5.24, valor p aprox. 0 
a F = 2.904, no 
b (.050,.254) 

a t = —2.657, .02 < valor p < .05 
b -4.542 ± 3.046 
T = 

_ (x+P-w0-( w -to-m) _ 

I7Z 


i(g^)[EU,-X) 2 + i E( y._f)2 + 1 ^OVi-liO 2 ]} 
con (3n — 3) grados de libertad 

10.129 X - f ^ ,=l ^ ~ y(1) ^ X 
V "ft.o / 
ZU(yi-ym) 


exp 


e. 


+ n 


Capi'tulo 11 

11 .3 y = 1-5 — . 6 x 
11.5 y = 21.575 + 4.842x 
11.7 a La relacion parece ser 
proporcional ax 2 , 
b No 

C No, es el mejor modelo lineal. 
11.9 b y = -15.45 +65.17x 
d 108.373 
11.11 ft = 2.514 

11.13 a La recta de mfnimos cuadrados es 
y = 452.119 -29.402.x 
11.17 a SSE = 18.286; 

S 2 = 18.286/6 = 3.048 
b La recta ajustada es 

y = 43.35 + 2.42x*. Se encuentra 


la misma respuesta para SSE 
(y por tanto S 2 ). 

11.19 a La recta de mfnimos cuadrados es 
5> = 3.00 + 4.75x 
C 5 2 = 5.025 

11.23 at — —5.20, rechazar H ft 
b .01 < valor p < .02 
C .01382 
d (-.967, -.233) 

11.25 a t = 3.791, valor p < .01 

b valor p de aplicacion = .0053 
C Rechazar 
d .475 ± .289 











11.29 

P\ ~ V] 

T = -. donde S = 

// i i \ 

11.75 

21.9375 + 3.01 

11.77 

Siguiendo el Ej. 11.76, el PI de 95% 


t + 


es 

39.9812 ±213.807 


(SSEy + SSE w)l( n + m — 4). 

11.79 

21.9375 ±6.17 


H 0 es rechazada a favor de H a 

11.83 

a 

F = 21.677, rechazar 


para valores gi'andes de | T \. 


b 

SSE R = 1908.08 

11.31 

t = 73.04, valor p aprox. 0, H 0 

11.85 

a 

F = 40.603, valorp < . 005 


es rechazada 


b 

950.1676 

11.33 

t = 9.62, si 

11.87 

a 

F = 4.5, F x = 9.24, no 

11.35 

* _ 

X = X. 



rechazar H 0 

11.37 

(4.67, 9.63) 


c 

F = 2.353, Fi = 2.23, rechazar 7 / 0 

11.39 

25.395 ± 2.875 

11.89 

a 

Verdadero 

11.41 

b (72.39,75.77) 


b 

Falso 

11.43 

(59.73, 70.57) 


c 

Falso 

11.45 

(-. 86 , 15.16) 

11.91 

F 

= 10.21 

11.47 

(.27, .51) 

11.93 

90.38 ± 8.42 

11.51 

t = 9.608, valor p < .01 

11.95 

a 

y = —13.54 — 0.053* 

11.53 

a r 2 = .682 


b 

t = - 6.86 


b .682 


c 

.929 ± .33 


C t = 4.146, rechazar 

11.97 

a 

y = 1.4825+ .5.ri+.1190x2— . 5^3 


d Valorp de aplicacion = .00161 


b 

y = 2.0715 

11.57 

a signo para r 


c 

t = —13.7, rechazar 


b r yn 


d 

( 1 . 88 , 2.26) 

11.59 

r = -.3783 


e 

(1.73, 2.41) 

11.61 

.979 ± .104 

11.99 

Si 

—9 < x £ 9, escoja nl 2 en x = —9 

11.63 

a Pi = -.0095, = 3.603 y 


ynllenx =9. 


&i = -(-.0095) = .0095, 

11.101 

a 

y = 9.34 + 2.46x1 + . 6 x 2 + .41xiX2 


a 0 = exp(3.603) = 36.70. 


b 

9.34,11.80 


Por lo tanto, la ecuacion de 


d 

Para bacterias A, y = 9.34. Para 


prediccion es y = 36.70e _ 0095 ' c . 



bacterias B, y = 11.80. Los 


b El Cl de 90% para a 0 es 



crecimientos observados fueron 9.1 


(e 3 - 5883 , e 3 6171 ) =(36.17, 37.23) 



12 . 2 , respectivamente. 

11.67 

y = 2.1 — ,6x 


e 

12.81 ± .37 

11.69 

a y = 32.725 + l.S\2x 


f 

12.81 ± .78 


b y = 35.5625 + 1.8119 jc-.1351x 2 

11.107 

a 

r = .89 

11.73 

t = 1.31, no rechazar 


b 

t = 4.78, valorp < .01, rechazar 


Capitulo 12 




12.1 

«i = 34, n 2 = 56 

12.15 

a 

t = 2.65, rechazar 

12.3 

n = 246, n l = 93, n 2 = 154 

12.17 

a 

Mi 

12.5 

Con n = 6 , tres ratas deberfan recibir 

12.31 

a 

Mi 


x = 2 unidades y tres ratas deberfan 
recibir 

x = 5 unidades. 

12.11 a Esto ocurre cuando p > 0. 
b Esto ocurre cuando p = 0. 

C Esto ocurre cuando p < 0. 
d Pareados mejor cuando p > 0, 
independiente mejor cuando p < 0 


12.35 


12.37 


c 

a 

b 

c 

h 


P : ' [Op + 

n 

pi ~ p, 2 , 2cr 2 /n, normal 
f = —4.326, .01 < valor p 
< .025 

-1.58 ± 1.014 
65 pares 

= h = .25; * 2 = -50 
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Capitulo 13 


1 3.1 a F = 2.93, no rechazar 
b .109 

C |?| = 1.71, no rechazar, F = t 2 
13.7 a F — 5.2002, rechazar 
b valor p =.01068 
1 3.9 SSE = .020; F = 2.0, no 
rechazar 

13.11 SST = .7588; SSE = .7462; 

F = 19.83, valor p < .005, rechazar 
13.13 SST = 36.286; SSE = 76.6996; 

F = 38.316, valor/? < .005, rechazar 
13.1 5 F = 63.66, si, valor p <. 005 
13.21 a -12.08 ±10.96 
b Mas largo 

C Menos grados de libertad 
13.23 a 1.568 ±.164 o (1.404, 1.732); si 
b (-.579,-.117); si 
13.25 .28 ±.102 

13.27 a 95% de Cl para p A : 76 ±8.142 


13.49 F = 6.36; rechazar 
13.53 El Cl de 95% es 2 ± 2.83. 

13.55 El Cl de 95% es .145 ± .179. 

13.57 El Cl de 95% es-4.8 ±5.259. 

13.59 n A £ 3 

13.61 b = 16; n=48 

13.63 Los tamanos muestrales difieren. 

13.69 a /So + (83 es la respuesta media 

al tratamiento A en el bloque III 
b /S3 es la diferencia en respuestas 
medias a los qulmicos A y D en el 
bloque III. 

13.71 F = 7; Ho es rechazada 
13.73 Tan homogenea como sea posible dentro 
de bloques 

13.75 b F = 1.05; no rechazar 
13.77 a A 95% Cl es .084 ± .06 o 
(.024, .144). 

13.79 a 16 


o (67.868,84.142) 

b 95% de Cl para p B '- 66.33 ± 10.51 o 
(55.82, 76.84) 

C 95% de Cl para p A — p B : 

9.667 ± 13.295 
13.29 a 6.24 ±.318 
b -.29 ± .241 
13.31 a F = 1.32, no 


b 135 grados de libertad dejados para 
error. 

C 14.14 

13.81 F = 7.33; si; el bloqueo induce perdida 
en grados de libertad para estimar o- 2 ; 
podrla resultar en perdida de vista de 
information si la variation de bloque a 
bloque es pequena 


b (-.21,4.21) 

13.33 (1.39,1.93) 

13.35 a 2.7 ±3.750 
b 27.5 ± 2.652 
13.37 a pi 

b Media general 
13.39 b ( 2 a 2 )/b 
13.41 a F = 3.11, no rechazar 
b valor p > .10 
C valor p = .1381 
d s 2 = 2MSE 

13.45 a F = 10.05; rechazar 
b F = 10.88; rechazar 

13.47 


Fuente 

gl 

SS 

MS 

F 

Tratamientos 

3 

8.1875 

2.729 

1.40 

Bloques 

3 

7.1875 

2.396 

1.23 

Error 

9 

17.5625 

1.95139 

Total 

15 

32.9375 




13.83 a 


Fuente 

gl 

SS MS 

F 

Tratamientos 

2 

524,177.167 262,088.58 

258.237 

Bloques 

3 

173,415 57,805.00 

56.95 

Error 

6 

6,089.5 1,014.9167 

Total 

11 

703,681.667 



b 

6 



c 

SI, F = 258.19, valor/? 

<.005 


d 

SI, F = 56.95, valor/? 

<.005 


e 

22.527 



f 

-237.25 ±55.13 


13.85 

a 

SST = 1.212, gl =4 



SSE = .571, gl = 22 
F = 11.68; valor p < .005 
b |f| = 2.73; H 0 es rechazada; 2(.005) 
< valor/? < 2 (. 01 ). 

13.87 Cada intervalo debe tener coeficiente de 
confianza 1 — .05/4 = .9875 ~ .99; 

Ma — Mo : -320 ± .251 
Mb — -145 ± .251 

Me — Mm -023 ± .251 
Mb — Md : “-124 ± .251 


F — 1.40, no rechazar 













894 Respuestas 


13.89 b Op 

c Op = 0 

13.91 a fjL-, Op + |of 

b rfi + (ft) E?=i t? 


C of + ko^ 


d of 


Capi'tulo 14 


14.1 

a 

X 2 = 3.696, no rechazar 

14.19 

a 

X 2 = 22.8705, rechazar 


b 

Valor p de aplicacion = .29622 


b 

valor p < .005 

14.3 

X 2 

= 24.48, valor p < .005 

14.21 

a 

X 2 — 13.99, rechazar 

14.5 

a 

z = 1.50, no rechazar 


b 

X 2 = 13.99, rechazar 


b 

Hipotesis sugerida por datos 


c 

X 2 = 1.36, no rechazar 



observados 

14.25 

b 

X 2 = 19.1723, valor p = 

14.7 

.102 ± .043 



0.003882, rechazar 

14.9 

a 

.39 ± .149 


c 

-.11 ±.135 


b 

.37 ± .187, .39 ± .182, .48 ± .153 

14.27 

X 2 

= 38.43, si 

14.11 

X 2 

= 69.42, rechazar 

14.29 

a 

X 2 — 14.19, rechazar 

14.13 

a 

X 2 — 18.711, rechazar 

14.31 

V 2 

= 21.51, rechazar 


b 

valor p < .005 

14.33 

X 2 

= 6.18, rechazar; .025 < valor p 


c 

valor p de aplicacion = .00090 


<.05 

14.15 

b 

X 2 tambien multiplicada por k 

14.35 

a 

Sf 

14.17 

a 

X 2 = 19.0434 con valor p de 


b 

valor p = .002263 



.004091. 

14.37 

X 2 

= 8.56, gl = 3; rechazar 


b 

X 2 = 60.139 con valor p 

14.41 

X 2 

= 3.26, no rechazar 



de aproximadamente 0 . 

14.43 

X 2 

= 74.85, rechazar 


c 

Algunas cuentas esperadas < 5 





Capitulo 15 


15.1 


Region de rechazo 


M <6 o M > 19 
M <7 o M > 18 
M <8 o M > 17 


7(M < 6 ) + P(M > 19) = .014 
P(M < 7) + 7(M > 18) = .044 
P(M < 8 ) + 7(A7 > 17) = .108 


15.3 

a 

m = 2 , sf 


b 

Varianzas no iguales 

15.5 

P(M <2oM>8) = .11,no 

15.7 

a 

P(M <2oM>7) = .18, 
no rechazar 


b 

t — —1.65, no rechazar 

15.9 

a 

valor p = . 011 , no rechazar 

15.11 

T 

= mm (T + , T~), T = T~. 

15.13 

a 

T = 6 , .02 < valor p < .05 


b 

7=6, 0.1 < valor p < .025 

15.15 

T 

= 3.5, .025 < valor p < .05 

15.17 

T 

= 11 , rechazar 

15.21 

a 

U = 4; valor p = .0364 


b 

(/= 35; valor p =.0559 


c 

U = 1; valor p = .0476 


15.23 

15.25 

15.27 

15.29 

15.31 


15.33 

15.37 

15.39 

15.41 


15.45 


15.47 


U = 9, no rechazar 
z = —1.80, rechazar 
[7=0, valor p = .0096 
H = 16.974, valorp <. 001 
a SST = 2586.1333; SSE = 
11,702.9; F = 1.33, no 
rechazar 

b H — 1.22, no rechazar 
H = 2.03, no rechazar 
a No, valor p = .6685 
b No rechazar H 0 
F r = 6.35, rechazar 
a F r = 65.675, valor p < .005, 
rechazar 

b m = 0, P(M = 0) = 1/256, 
valor p = 1 / 128 

La distribucion nula esta dada por 
P(F r =0) = P(F r =4) = 1/6 y 
P(F r = 1) = P(F r = 3) = 1/3. 
R = 6, no 
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15.49 

15.51 

15.53 

15.55 

15.57 

15.59 

16.1 

16.3 

16.7 

16.9 


a .0256 

b Un numero normalmente pequeno 
de lotes (juzgados a a = .05) 
implicarla una agrupacion de piezas 
defectuosas en tiempo; no rechazar. 
R = 13. no rechazar 
r s = .911818; si. 
a r s = -.8449887 
b Rechazar 

r s = .6768, usar prueba de dos colas, 
rechazar 

r s = 0; valor p < .005 

Capitulo 16 

a /3( 10,30) 
b n = 25 

C /3(10, 30), n =25 
d SI 

e Posterior para p( 1,3) previa. 

C Las medias se acercan a .4. desv. 

est. Disminuye 
e Se ve cada vez mas como 
distribution normal. 

Y + 1 

a -- 

n + 4 

b n P + 1 . ~ P) 

71 + 4 (7! + 4) 2 

. cr + 1 

b -; 

a + fi + Y 

(a-+ l)(j3 + r - 1) 


(a +/3 + F + l)(a + P + Y) 



15.61 a Diseno aleatorizado de bloque 
b No 

C valor p = .04076, si 
15.63 T = 73.5. no rechazar, consistente 
con el Ej. 15.62 

15.65 U = 17.5. no rechazar H 0 
15.67 .0159 

15.69 H= 7.154, rechazar 
15.71 F r — 6.21. no rechazar 
15.73 .10 


16.13 a (.099, .710) 

b Ambas probabilidades son .025 
C P(.099 < p < .710) = .95 
h Mas corta para n mas grande. 
16.15 (.06064, .32665) 

16.17 (.38475, .66183) 

16.19 (5.95889,8.01066) 

16.21 Probabilidades posteriores de nulo 
y alternativa son .9526 y .0474, 
respectivamente, aceptar H 0 . 

16.23 Probabilidades posteriores de nulo 
y alternativa son .1275 y .8725, 
respectivamente, aceptar H a . 
16.25 Probabilidades posteriores de nulo 
y alternativa son .9700 y .0300, 
respectivamente, aceptar H 0 . 


16.11 
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n este exitoso texto, el mas ampliamente utilizado en las 200 mejores escuelas 
de Estados Unidos, los autores Dennis D. Wackerly, William Mendenhall III y 
Richard L. Scheaffer, presentan la teoria de la estadistica en el contexto de la 
solution de problemas practicos y aplicaciones al mundo real. Utilizan eficiente- 
mente las matematicas como una herramienta necesaria para promover una 
fir me comprension de las tecnicas estadisticas. Este planteamiento practico le 
ayuda al lector a descubrir la naturaleza de la estadistica y a comprender rapida- 
mente su importante papel en la investigation cientifica. 

^Como aprovechar al maximo este texto? 

• Los autores enfatizan la conectividad, explican como los grandes temas juegan 
un importante papel en la inferencia estadistica y como se relacionan entre 
si, asegurando la lectura de las introducciones y los resumenes de capitulo. 

• Los conceptos importantes se agrupan como definiciones. Lealos y vuelvalos a leer 
hasta que los entienda, asi como el marco en el que todos ellos se desarrollan. 

• Trabaje los ejercicios para poner su nuevo conocimiento a prueba. Ya que muchos 
ejercicios estan basados en datos reales o en escenarios experimentales 
actuales, esto le permite ver los diferentes usos practicos de varios meto- 
dos estadisticos y probabilisticos. 

• Utilice la coleccion de applets interactivos en llnea (simulaciones) para 
desarrollar su conocimiento y la comprension de los conceptos clave. 

Por todo esto y mucho mas que encontrara al interior del libro, estamos seguros 
que lo convertira en su libro de cabecera para sus cursos de estadistica. 
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